Linux内核分析——进程的描述和进程的创建

时间:2021-07-24 15:48:48

              进程的描述和进程的创建

一、 进程的描述

(一)进程控制块PCB——task_struct

1、操作系统的三大管理功能包括:

  (1)进程管理

  (2)内存管理

  (3)文件系统

2、PCB task_struct中包含:

  (1)进程状态

  (2)进程打开的文件

  (3)进程优先级信息

3、通过唯一的进程标识PID来区别每个进程。

4、进程控制块PCB——task_struct

 Linux内核分析——进程的描述和进程的创建

5、进程状态

Linux内核分析——进程的描述和进程的创建 

  (1)创建新进程后实际的状态是TASK_RUNNING,就绪但是没有运行,调度器选择一个task之后进入运行态,也叫TASK_RUNNING。

  (2)当进程是TASK_RUNNING时,代表这个进程是可运行的,至于它有没有真的在运行,取决于它有没有获得cpu的控制权,即有没有在cpu上实际的运行。

  (3)一个正在进行的进程调用do_exit(),进入TASK_ZOMBIE,进程被终止,“僵尸进程”。

  (4)等待特定时间或者资源的时候,进入阻塞态,如果条件满足就进入就绪态,被选择后进入运行态。

6、理解task_struct数据结构

 Linux内核分析——进程的描述和进程的创建

  (1)进程的标示pid

  (2)为了对给定类型的进程进行有效的搜索,内核维护了几个进程链表。

  (3)所有进程链表struct list_head tasks

 Linux内核分析——进程的描述和进程的创建

 Linux内核分析——进程的描述和进程的创建

7、CPU相关的状态

 Linux内核分析——进程的描述和进程的创建

二、 进程的创建

(一)进程的创建概览及fork一个进程的用户态代码

 Linux内核分析——进程的描述和进程的创建

1、fork一个子进程的代码:

#include <stdio.h>

#include <stdlib.h>

#include <unistd.h>

int main(int argc, char * argv[])

{

    int pid;

    /* fork another process */

    pid = fork();

    if (pid < 0)

    {

        /* error occurred */

        fprintf(stderr,"Fork Failed!");

        exit(-1);

    }

    else if (pid == 0)

    {

        /* child process */

        printf("This is Child Process!\n");

    }

    else

    { 

        /* parent process  */

        printf("This is Parent Process!\n");

        /* parent will wait for the child to complete*/

        wait(NULL);

        printf("Child Complete!\n");

    }

}

  (1)fork()系统调用从内核返回两次:一次回到父进程,另一次回到新产生的子进程。

  (2)fork()实际上是由clone()系统调用实现的。

(二)理解进程创建过程复杂代码的方法

1、调用fork的过程:

Linux内核分析——进程的描述和进程的创建

(三)创建一个新进程在内核中的执行过程

  • fork、vfork和clone三个系统调用都可以创建一个新进程,而且都是通过调用do_fork来实现进程的创建;
  • Linux通过复制父进程来创建一个新进程,那么这就给我们理解这一个过程提供一个想象的框架:
  • 复制一个PCB——task_struct
  1. err = arch_dup_task_struct(tsk, orig);
  • 要给新进程分配一个新的内核堆栈
    1. ti = alloc_thread_info_node(tsk, node);
    2. tsk->stack = ti;
    3. setup_thread_stack(tsk, orig); //这里只是复制thread_info,而非复制内核堆栈
      • 要修改复制过来的进程数据,比如pid、进程链表等等都要改改吧,见copy_process内部。
    • 从用户态的代码看fork();函数返回了两次,即在父子进程中各返回一次,父进程从系统调用中返回比较容易理解,子进程从系统调用中返回,那它在系统调用处理过程中的哪里开始执行的呢?这就涉及子进程的内核堆栈数据状态和task_struct中thread记录的sp和ip的一致性问题,这是在哪里设定的?copy_thread in copy_process
      1. *childregs = *current_pt_regs(); //复制内核堆栈
      2. childregs->ax = 0; //为什么子进程的fork返回0,这里就是原因!
      3. p->thread.sp = (unsigned long) childregs; //调度到子进程时的内核栈顶
      4. p->thread.ip = (unsigned long) ret_from_fork; //调度到子进程时的第一条指令地址

      新进程执行起点:return_from_fork,只复制了内核堆栈一部分,int指令和save_all压到内核栈的内容,参数、系统调用号等都进行压栈。

      (四)使用gdb跟踪创建新进程的过程

      1、准备工作:

        rm menu -rf

        git clone http://github.com/mengning/menu.git   //更新Menu

        cd menu

        mv test_fork.c test.c   //把test.c覆盖掉

        make rootfs

       Linux内核分析——进程的描述和进程的创建Linux内核分析——进程的描述和进程的创建

      Linux内核分析——进程的描述和进程的创建

      2、进行gdb调试:

        qemu -kernel linux-3.18.6/arch/x86/boot/bzImage -initrd rootfs.img -s -S

        gdb

        file linux-3.18.6/vmlinux

        target remote:1234

        // 设置断点

        b sys_clone  //因为fork实际上是执行的clone

        b do_fork

        b dup_task_struct

        b copy_process

        b copy_thread

        b ret_from_fork

        c

        n

       Linux内核分析——进程的描述和进程的创建

        tsk->stack = ti;    //把内核堆栈的地址赋给它

        sturct pt_regs *childregs = task_pg_regs(p);  //把内核堆栈压栈的空间地址找到,初始化。

        *childregs = *current_pt_regs(); 

        childregs->ax = 0;  //把当前进程的内核堆栈的压的寄存器赋值到子进程中来。

        p->thread.ip = (unsigned long) ret_from_fork; //设置子进程被调度的ip,即子进程的起点

        jmp syscall_exit;   //这之后就跟踪不到了。

      三、总结

        进程就是处于执行期的程序;进程就是正在执行的程序代码的实时结果;进程是处于执行期的程序以及相关的资源的总称。

      进程在创建它的时刻开始存活。在Linux系统中,这通常是调用fork()系统的结果。fork()系统调用从内核返回两次:一次回到父进程,另一次回到新产生的子进程。它实际上是由clone()系统调用实现的。