20169212《Linux内核原理与分析》第八周作业

时间:2022-10-12 23:37:36

理论

  1. task_struct的结构关系

    非常庞大的数据结构,400多行代码。包括对进程链表的管理,控制台,文件系统描述,文件描述符,内存管理描述,信号描述等。

    20169212《Linux内核原理与分析》第八周作业
  2. 创建一个新进程在内核中的执行过程

    fork、vfork和clone三个系统调用都可以创建一个新进程,而且都是通过调用do_fork来实现进程的创建;Linux通过复制父进程来创建一个新进程,那么这就给我们理解这一个过程提供一个想象的框架:

    复制一个PCB——task_struct
err = arch_dup_task_struct(tsk, orig);

要给新进程分配一个新的内核堆栈

ti = alloc_thread_info_node(tsk, node);
tsk->stack = ti;
setup_thread_stack(tsk, orig); //这里只是复制thread_info,而非复制内核堆栈

要修改复制过来的进程数据,比如pid、进程链表等等都要改改吧,见copy_process内部。

从用户态的代码看fork();函数返回了两次,即在父子进程中各返回一次,父进程从系统调用中返回比较容易理解,子进程从系统调用中返回,那它在系统调用处理过程中的哪里开始执行的呢?这就涉及子进程的内核堆栈数据状态和task_struct中thread记录的sp和ip的一致性问题,这是在哪里设定的?copy_thread in copy_process

1 *childregs = *current_pt_regs();   //复制内核堆栈
2 childregs->ax = 0; //为什么子进程的fork返回0,这里就是原因!
3
4 p->thread.sp = (unsigned long) childregs; //调度到子进程时的内核栈顶
5 p->thread.ip = (unsigned long) ret_from_fork; //调度到子进程时的第一条指令地址

实验(使用gdb跟踪创建新进程)

fork、vfork和clone三个系统调用都可以创建一个新进程,而且都是通过调用do_fork来实现进程的创建,do_fork完成了创建中的大部分工作。

具体分析过程如下:

cd LinuxKernel
ls
cd menu
vi test.c

在这里与上次实验一样,仍然使用不了git clone这样的命令,于是自己进入menu目录下,对立面的test.c进行修改,修改如下:

#include <unistd.h>  //添加头文件到文件中

int Fork(int argc, char *argv[])  //添加一个新的函数Fork()
{
int pid;
/* fork another process */
pid = fork(); //fork之后变为两个进程
if (pid<0)
{
/* error occurred */
fprintf(stderr,"Fork Failed!");
exit(-1);
}
else if (pid==0) //子进程中fork的返回值为0
{
/* child process */
printf("This is Child Process!\n");
}
else
{
/* parent process */
printf("This is Parent Process!\n"); //父进程中fork的返回值为子进程的ID
/* parent will wait for the child to complete*/
wait(NULL);
printf("Child Complete!\n");
}
}
通过这个小程序,可以在用户态创建一个子进程。
//main函数中需要加入:
MenuConfig("fork","Fork a new process",Fork);

保存并退出。

在menu目录下make rootfs便可编译,成功启动MenuOS系统,输入help可以看到如图所示的效果

20169212《Linux内核原理与分析》第八周作业

接下来要使用gdb来跟踪调试进程创建过程,所以需要设置断点。

qemu -kernel linux-3.18.6/arch/x86/boot/bzImage initrd rootfs.img -s -S
gdb
file linux-3.18.6/vmlinux //加载内核
target remote:1234 //链接到menu os里

分别在sys_clone,do_fork,dup_task_struct,copy_process,copy_thread,ret_from_fork这几处设置断点,如图

20169212《Linux内核原理与分析》第八周作业

当按c继续执行之后,后面的断点依次如图所示

20169212《Linux内核原理与分析》第八周作业

图4中出现了 copy_process

20169212《Linux内核原理与分析》第八周作业

再继续跟踪可以看到如下

20169212《Linux内核原理与分析》第八周作业

20169212《Linux内核原理与分析》第八周作业

问题:

新进程从哪里开始执行?

回答:ret_from_fork决定了新进程的第一条指令地址:

p->thread.ip = (unsigned long) ret_from_fork; //调度到子进程时的第一条指令地址

总结:

  1. Linux通过复制父进程来创建一个子进程,通过调用fork来实现;
  2. Linux会为每个子进程动态的分配一个task_struct结构;
  3. Linux用双向循环链表的方式来组织系统中的所有进程(包括内核线程)
  4. fork()函数被调用一次,但返回两次

书上内容

  1. 时钟中断的工作:跟新系统运行时间;跟新实际时间;在SMP系统中均衡调度各处理器的运行列队;检查当前进程是否耗尽时间片,若耗尽则进行重新调度;运行超时的动态定时器;更新资源消耗和处理器时间的统计值。提高HZ的优点:更高时钟中断解析度;提高时间驱动事件的准确性(平均误差5ms->0.5ms);内核定时器能够以更高的频度和更高准确度执行;依赖定时器的系统调用(如poll和select)能以更高精度运行;对资源消耗和系统运行时间的测量更准确;提供进程抢占的准确度。
  2. 定时器是管理内核流逝的时间的基础。使用很简单,执行一些初始化的工作,设置一个超时时间,指定超时发生后执行的函数,然后激活定时器就可以了。定时器与当前执行代码是异步的,因此就有可能存在潜在的竞争条件。
  3. 内核把物理页作为内存管理的基本单位;区:ZONE_DMA:包含的页用来执行DMA操作;ZONE_NORMAL:正常映射的页;ZONE_HIGHMEM:“高端内存”(并不能永久映射到内核地址空间);释放页:void __free_pages(struct page *page, unsigned int order); void free_pages(unsigned long addr, unsigned int order); void free_page(unsigned long addr)。gfp_mask该标志可以分为三类:(1)行为修饰符:描述内核如何分配所需内存。(2)区修饰符:从哪个区分配内存。(3)类型:组合了行为和区修饰符,提供了常用的标志。
  4. 使用每个cpu数据具有不少好处。首先是减少了数据锁定,第二是使用每个cpu数据可以大大减少缓存失效。目前并不要求必须使用每个cpu的新接口,新接口并不向后兼容之前的内核。