高级操作系统——进程管理

时间:2024-01-26 14:11:08

一、进程描述符

进程控制块PCB:是OS控制进程运行用的数据结构,是一个task_struct结构体。

PCB包括:进程标识信息(进程标识符PID等)、执行现场信息(CPU现场,进程切换时需要保存现场信息)、进程映像信息(进程地址空间,即进程在运行时代码、数据、栈放在什么位置,方便OS对地址空间进行管理)(现场与地址空间比较重要)、进程资源信息、信号信息。

对PCB,说其中几个重要的字段:

mm_struct:有一个成员mm,标明了进程的地址空间;

thread:记录了进程的现场,最后一个字段;

thread_info在4.4.6版本中改成了stack,包括内核栈(即进程进入内核工作时需要的栈和用户栈是分开的)和一些需要快速访问的数据。

 

 

在4.4.6版本中,stack占用了两个页面,即8k,大部分是放内核栈的,低端约10k存放快速访问的信息。CPU若想访问当前进程的快速访问数据的话,只需要拿到当前的栈指针,即ESP寄存器的值,可以推算出数据所在的位置来,因此在查找他的地址的时候,访问速度可以很快。这部分数据可以看作是进程描述符的一部分,在空间上不是连续的,但相互之间有指针,可以相互找得到。

 

 

进程状态转换图,可自行搜索。

在4.4.6中,增加了被跟踪和僵死撤销状态。

进程描述符是管理进程的重要数据结构,故他的组织方式非常重要。0号进程的描述符是由init_task这个变量所存储的。从他出发,所有进程描述符构成了双向链表。task_struct中包含一个成员,叫tasts,tasks类型是list_head类型,tasts本身是嵌入在进程描述符里面的,知道tasks的地址,只要送减去620就能得到进程描述符的首地址。在Linux中有很多这样的技巧,即通过嵌入的地址,反推结构体的地址,进而找到结构体的其他成员。

 

 

进程与线程关系

多个线程构成线程组,共享内存,不共享栈。

一个会话对应一个终端,在终端中敲一个命令相当于创建了一个进程组来执行。

下面进行演示,建立一个文件命名为0.gdb,文件内容如下,直接运行

1 target remote localhost:1234
2 dir ~/aos/lab/busybox
3 add-symbol-file ~/aos/lab/busybox/busybox_unstripped 0x8048400
4 display $lx_current().pid
5 display $lx_current().comm
6 b start_kernel
7 b ls_main
8 c

 

 

执行含有下列代码的文件

 1 #include <stdio.h>
 2 #include <stdlib.h>
 3 #include <pthread.h>
 4 
 5 void loop(){
 6   while(1);
 7 }
 8 
 9 void *p1(){
10   printf("thread-1 starting\n");
11   loop();
12 }
13 
14 void *p2(){
15   printf("thread-2 starting\n");
16   loop();
17 }
18 
19 void main(){
20   int pid1, pid2;
21   pthread_t t1,t2;
22   void *thread_result;
23 
24   printf("main starting\n");
25 
26   if (!(pid1 = fork())){
27     printf("child-1 starting\n");
28     loop();
29     exit(0);
30   }
31 
32   if (!(pid2 = fork())){
33     printf("child-2 starting\n");
34     loop();
35     exit(0);
36   }
37 
38   pthread_create(&t1, NULL, p1, NULL);
39   pthread_create(&t2, NULL, p2, NULL);
40   
41   pthread_join(t1, &thread_result);
42   pthread_join(t2, &thread_result);
43 
44   int status;
45   waitpid(pid1, &status, 0);
46   waitpid(pid2, &status, 0);
47   printf("main exiting\n");
48   exit(0);
49 }

 可以看到do-fork可执行文件创建了三个进程,976、977、978

 

 

 

979、980是新创建的两个线程

 

 再执行一次,可以看到后台运行了两个

 

 新创建的三个进程是刚创建的

 

 fg %+序号将指定的进程放到前台,ctrl+z放到后台

 

 

用以下三条命令依次查看线程组、进程组和会话的leader

命令的意思是根据进程的描述符,找到线程组leader的描述符,里面对应的字段就是要显示的ID

p $lx_task_by_pid(977).group_leader->pids[0].pid->numbers.nr
p $lx_task_by_pid(977).group_leader->pids[1].pid->numbers.nr
p $lx_task_by_pid(977).group_leader->pids[2].pid->numbers.nr

987和988是984创建的,他们处于同一个线程组,leader是976

 

二、进程调度算法

每个进程属于某一个调度器类,每个调度器类都有一个进程队列,不同的队列有不同的调度算法。

先调度硬实时的,软实时次之,普通进程最后。

普通进程使用CFS(完全公平)调度算法:

虚拟时钟,调度器总是选时钟最小的那个进程来执行。

优先级高的进程时钟增长得慢。

所有可运行的进程被放在一个红黑树中。

 

下面进行演示:

再次运行0.gdb,在终端输入ls,使其被捕获

 

 

 

建立文件demo-2-2.gdb,内容如下

 1 break __schedule//进程调度的时候执行这个函数
 2 
 3 break __switch_to//调度时如果切换进程就会调用这个函数
 4   commands
 5     printf "next_p->pid: %d\n", next_p->pid
 6     printf "next_p->se.vruntime: "
 7     print  next_p->se.vruntime
 8   end
 9 
10 break enqueue_task_fair//如果有新进程要进入到CFS队列时,执行这个函数
11   commands
12     printf "p->pid: %d\n", p->pid
13     printf "p->se.vruntime: "
14     print  p->se.vruntime
15   end
16 
17 display   $lx_current().state//显示当前进程的状态
18 display   $lx_current().se.vruntime
19 display   $lx_per_cpu("runqueues").nr_running//CPU里面有多少个进程在运行
20 
21 display ((struct sched_entity *)((void *)$lx_per_cpu("runqueues").cfs.rb_leftmost - 0x8))->vruntime//CFS队列里最左边的节点,即虚拟时钟最小的信息
22 display ((struct task_struct *)((void *)$lx_per_cpu("runqueues").cfs.rb_leftmost - 0x4c))->pid

 

 

  由上图可以看到,当前正在运行的是975号进程,当前的虚拟时钟可以从runtime那里看到,state=0表示其当前的状态是就绪的或正在运行,树最左边目前还没有进程。由于enqueue_task_fair函数的作用是往进程队列里面加入新进程,现在已经有一个,可以看到,要加的是7号进程,下面一行的虚拟时钟是个负值,现在还暂时看不到,继续执行。

 

 可以看到7号进程的虚拟时钟小于975号的,下次如果要调度,应该选7号。即将创建的是3号进程。

 

 由上图,975号进程的虚拟时钟增加了,在这两个断点时间,存在中断,这才导致了时钟的增加。运行有一定的随机性,虚拟机在虚拟的时候有一定的随机性。继续

 

 运行了切换函数,下一步要切换7号进程。继续

 

 7号时钟的进程的时钟比之前也增加了,需要注意当前正在运行的进程不放在树里面,但放在了队列里面,队列里面进程就是树里面的进程加当前进程。继续若干次

 

 下一步要创建的是4号进程。

 

除了普通进程有队列之外,其他的硬实时和软实时都有各自的队列。

红黑树的某个节点可以是另外一个树,共用一个时钟。

 

三、进程调度的时机

内核程序的入口,系统调用总控函数,异常处理函数,中断处理函数、内核线程主函数,用bt查看栈顶层,根据函数的种类来确定是哪种内核调用。