深入剖析Linux进程在内核眼中到底是什么样子的?

资讯 2年前 (2022) 千度导航
11 0 0

从程序到进程再到内核

啥是程序,啥是进程,一张图可以给我们解释:

深入剖析Linux进程在内核眼中到底是什么样子的?

接下来我们转换镜头,站在内核OS的视角看什么是程序,什么是进程。ELF可执行文件送给内核后,OS是如何看待它的呢?换句话讲,内核OS眼里只有进程:

深入剖析Linux进程在内核眼中到底是什么样子的?

通过 top 命令我们可以看到 linux 的各种进程(即上右图)。

更多linux内核视频教程文档资料免费领取后台私信【内核】自行获取.

深入剖析Linux进程在内核眼中到底是什么样子的?

深入剖析Linux进程在内核眼中到底是什么样子的?

Linux内核源码/内存调优/文件系统/进程管理/设备驱动/网络协议栈-学习视频教程-腾讯课堂

内核通过 task_struct 描述进程

用命令 pstree 可以让内核以树形的结构把进程之间的关系列出来,如下图:

深入剖析Linux进程在内核眼中到底是什么样子的?

这是进程在内核中的结构形式,那么内核是如何来以树形结构管理描述这些进程的呢?用来描述进程的数据结构,可以理解为进程的属性。比如进程的状态、进程的标识(PID)等,都被封装在了进程描述符这个数据结构中,一起来看下今天的主角—— task_struct结构体。


struct task_struct {
volatile long state;  //说明了该进程是否可以执行,还是可中断等信息 -1 unrunnable, 0 runnable, >0 stopped
unsigned long flags;  //Flage 是进程号,在调用fork()时给出
int sigpending;    //进程上是否有待处理的信号
mm_segment_t addr_limit; //进程地址空间,区分内核进程与普通进程在内存存放的位置不同
                        //0-0xBFFFFFFF for user-thead
                        //0-0xFFFFFFFF for kernel-thread
//调度标志,表示该进程是否需要重新调度,若非0,则当从内核态返回到用户态,会发生调度
volatile long need_resched;
int lock_depth;  //锁深度
long nice;       //进程的基本时间片
//进程的调度策略,有三种,实时进程:SCHED_FIFO,SCHED_RR, 分时进程:SCHED_OTHER
unsigned long policy;
struct mm_struct *mm; //进程内存管理信息
int processor;
//若进程不在任何CPU上运行, cpus_runnable 的值是0,否则是1 这个值在运行队列被锁时更新
unsigned long cpus_runnable, cpus_allowed;
struct list_head run_list; //指向运行队列的指针
unsigned long sleep_time;  //进程的睡眠时间
//用于将系统中所有的进程连成一个双向循环链表, 其根是init_task
struct task_struct *next_task, *prev_task;
struct mm_struct *active_mm;
struct list_head local_pages;       //指向本地页面      
unsigned int allocation_order, nr_local_pages;
struct linux_binfmt *binfmt;  //进程所运行的可执行文件的格式
int exit_code, exit_signal;
int pdeath_signal;     //父进程终止时向子进程发送的信号
unsigned long personality;
//Linux可以运行由其他UNIX操作系统生成的符合iBCS2标准的程序
int did_exec:1; 
pid_t pid;    //进程标识符,用来代表一个进程
pid_t pgrp;   //进程组标识,表示进程所属的进程组
pid_t tty_old_pgrp;  //进程控制终端所在的组标识
pid_t session;  //进程的会话标识
pid_t tgid;
int leader;     //表示进程是否为会话主管
struct task_struct *p_opptr,*p_pptr,*p_cptr,*p_ysptr,*p_osptr;
struct list_head thread_group;   //线程链表
struct task_struct *pidhash_next; //用于将进程链入HASH表
struct task_struct **pidhash_pprev;
wait_queue_head_t wait_chldexit;  //供wait4()使用
struct completion *vfork_done;  //供vfork() 使用
unsigned long rt_priority; //实时优先级,用它计算实时进程调度时的weight值
struct timer_list real_timer;   //指向实时定时器的指针
struct tms times;      //记录进程消耗的时间
unsigned long start_time;  //进程创建的时间
//记录进程在每个CPU上所消耗的用户态时间和核心态时间
long per_cpu_utime[NR_CPUS], per_cpu_stime[NR_CPUS]; 
int swappable:1; //表示进程的虚拟地址空间是否允许换出
int ngroups; //记录进程在多少个用户组中
gid_t groups[NGROUPS]; //记录进程所在的组
//进程的权能,分别是有效位集合,继承位集合,允许位集合
kernel_cap_t cap_effective, cap_inheritable, cap_permitted;
int keep_capabilities:1;
struct user_struct *user;
struct rlimit rlim[RLIM_NLIMITS];  //与进程相关的资源限制信息
unsigned short used_math;   //是否使用FPU
char comm[16];   //进程正在运行的可执行文件名
 //文件系统信息
int link_count, total_link_count;
//NULL if no tty 进程所在的控制终端,如果不需要控制终端,则该指针为空
struct tty_struct *tty;
unsigned int locks;
//进程间通信信息
struct sem_undo *semundo;  //进程在信号灯上的所有undo操作
struct sem_queue *semsleeping; //当进程因为信号灯操作而挂起时,他在该队列中记录等待的操作
//进程的CPU状态,切换时,要保存到停止进程的task_struct中
struct thread_struct thread;
  //文件系统信息
struct fs_struct *fs;
  //打开文件信息
struct files_struct *files;
  //信号处理函数
spinlock_t sigmask_lock;
struct signal_struct *sig; //信号处理函数
sigset_t blocked;  //进程当前要阻塞的信号,每个信号对应一位
struct sigpending pending;  //进程上是否有待处理的信号
......
};

内核就是通过list_head链表把各个进程关系以树形结构管理起来的。

task_struct 结构体内容太多,这里只列出部分成员变量,感兴趣的读者可以去源码 include/linux/sched.h头文件查看。task_struct 中的主要信息分类:

1. 标示符:描述本进程的唯一标识符,用来区别其他进程。 2. 状态:任务状态,退出代码,退出信号等 3. 优先级:相对于其他进程的优先级 4. 程序计数器:程序中即将被执行的下一条指令的地址 5. 内存指针:包括程序代码和进程相关数据的指针,还有和其他进程共享的内存块的指针 6. 上下文数据:进程执行时处理器的寄存器中的数据 7. I/O状态信息:包括显示的I/O请求,分配的进程I/O设备和进程使用的文件列表 8. 记账信息:可能包括处理器时间总和,使用的时钟总和,时间限制,记帐号等

这些信息每类都可以单独开个章节去讲解,这里先简单描述下任务状态的转换,以后篇章再深入介绍各个分类。

任务状态转换

上面可以看到变量定义后面的注释,它说明变量内容<0是不运行的,=0是运行状态,>0是停止状态。下面我们介绍几个常用的取值:

深入剖析Linux进程在内核眼中到底是什么样子的?

任务状态在不同情况下的状态转换如下:

深入剖析Linux进程在内核眼中到底是什么样子的?

内核如何存放 task_struct

我们知道一个进程所占的栈空间有用户栈和内核栈,那么内核栈是如何存放进程描述符的呢?

内核栈对于应用程序是不可见的,因为它位于内核空间中。在应用程序执行过程中,如果发生异常、中断或系统调用的话,应用程序会被暂停,系统进入内核态,转去执行异常响应等代码,这个时候所使用的栈就是内核栈。

深入剖析Linux进程在内核眼中到底是什么样子的?

为了节省空间,linux把内核栈和紧挨着task_struct的thread_info放在一起,如上所示,thread_info中存放了进程/线程(内核不大区分进程与线程)的一些数据,其中包括指向task_struct结构的指针。数组stack即内核栈,stack占据8K/4K(依配置不同)空间。


union thread_union {
#ifndef CONFIG_THREAD_INFO_IN_TASK
  struct thread_info thread_info;
#endif
  unsigned long stack[THREAD_SIZE/sizeof(long)];
};

最后

到这里应该已经了解了一个程序如何转换为进程,内核如何描述进程,又如何存储进程,当然还有很多关于进程的描述没有介绍,比如进程的调度,优先级,内存管理等等

版权声明:千度导航 发表于 2022年7月6日 23:00。
转载请注明:深入剖析Linux进程在内核眼中到底是什么样子的? | 千度百科

相关文章