《Linux内核分析》第八周笔记 进程的切换和系统的一般执行过程

时间:2022-03-12 10:18:14

20135132陈雨鑫 + 原创作品转载请注明出处 + 《Linux内核分析》MOOC课程http://mooc.study.163.com/course/USTC-1000029000 ”

一、进程调度与进程调度的时机分析

  1、进程调度

  不同类型的进程有不同的调度需求

  第一种分类
      I/O-bound
           频繁的进行I/O
           通常会花费很多时间等待I/O操作的完成
     CPU-bound
           计算密集型
           需要大量的CPU时间进行运算
  第二种分类
     批处理进程(batch process)
           不必与用户交互,通常在后台运行
           不必很快响应
           典型的批处理程序:编译程序、科学计算
     实时进程(real-time process)
           有实时需求,不应被低优先级的进程阻塞
           响应时间要短、要稳定
           典型的实时进程:视频/音频、机械控制等
       交互式进程(interactive process)
           需要经常与用户交互,因此要花很多时间等待用户输入操作
           响应时间要快,平均延迟要低于50~150ms
          典型的交互式程序:shell、文本编辑程序、图形应用程序等

  内核中的调度算法相关代码使用了类似OOD的策略模式。

  2、进程调度的时机

  • 中断处理过程(包括时钟中断、I/O中断、系统调用和异常)中,直接调用schedule(),或者返回用户态时根据need_resched标记调用schedule();

   《Linux内核分析》第八周笔记 进程的切换和系统的一般执行过程

  • 内核线程可以直接调用schedule()进行进程切换,也可以在中断处理过程中进行调度,也就是说内核线程作为一类的特殊的进程可以主动调度,也可以被动调度;

  • 用户态进程无法实现主动调度,仅能通过陷入内核态后的某个时机点进行调度,即在中断处理过程中进行调度。

二、进程上下文切换相关代码分析

  1、进程的切换

    1)为了控制进程的执行,内核必须有能力挂起正在CPU上执行的进程,并恢复以前挂起的某个进程的执行,这叫做进程切换、任务切换、上下文切换;

    2)挂起正在CPU上执行的进程,与中断时保存现场是不同的,中断前后是在同一个进程上下文中,只是由用户态转向内核态执行;

    3)进程上下文包含了进程执行需要的所有信息

    • 用户地址空间:包括程序代码,数据,用户堆栈等

    • 控制信息:进程描述符,内核堆栈等

    • 硬件上下文(注意中断也要保存硬件上下文只是保存的方法不同)

    4)schedule()函数选择一个新的进程来运行,并调用context_switch进行上下文的切换,这个宏调用switch_to来进行关键上下文切换

    •next = pick_next_task(rq, prev);//进程调度算法都封装这个函数内部

    •context_switch(rq, prev, next);//进程上下文切换

    •switch_to利用了prev和next两个参数:prev指向当前进程,next指向被调度的进程

  2、代码分析

  关键汇编代码:

 《Linux内核分析》第八周笔记 进程的切换和系统的一般执行过程

    outout: thread.sp:内核态,sp是内核堆栈的栈顶

        thread.ip:当前进程的eip

《Linux内核分析》第八周笔记 进程的切换和系统的一般执行过程

    input: prev_sp:下一个进程的内核堆栈的栈顶

        prev_ip:下一个进程执行的起点

《Linux内核分析》第八周笔记 进程的切换和系统的一般执行过程

 

这两句完成了内核堆栈的切换,将当前内核堆栈的栈顶保存起来,把下一个next进程的栈顶放到ESP寄存器中,之后的压栈动作都是在next进程堆栈中完成:

《Linux内核分析》第八周笔记 进程的切换和系统的一般执行过程

next_ip一般是$1f,对于新创建的子进程是ret_from_fork。

三、Linux系统的一般执行过程

  1、最一般的情况:正在运行的用户态进程X切换到运行用户态进程Y的过程

  • 正在运行的用户态进程X
  • 发生中断——save cs:eip/esp/eflags(current) to kernel stack,then load cs:eip(entry of a specific ISR) and ss:esp(point to kernel stack).
  • SAVE_ALL //保存现场
  • 中断处理过程中或中断返回前调用了schedule(),其中的switch_to做了关键的进程上下文切换
  • 标号1之后开始运行用户态进程Y(这里Y曾经通过以上步骤被切换出去过因此可以从标号1继续执行)
  • restore_all //恢复现场
  • iret - pop cs:eip/ss:esp/eflags from kernel stack
  • 继续运行用户态进程Y

  2、几种特殊情况

  • 通过中断处理过程中的调度时机,用户态进程与内核线程之间互相切换和内核线程之间互相切换,与最一般的情况非常类似,只是内核线程运行过程中发生中断没有进程用户态和内核态的转换;
  • 内核线程主动调用schedule(),只有进程上下文的切换,没有发生中断上下文的切换,与最一般的情况略简略;
  • 创建子进程的系统调用在子进程中的执行起点及返回用户态,如fork;
  • 加载一个新的可执行程序后返回到用户态的情况,如execve;

    next_ip=ret_from_fork

  3、进程的地址空间一共有4G,其中0——3G是用户态可以访问,3G以上只有内核态可以访问

 四、系统架构和执行过程概述

  1、系统架构

《Linux内核分析》第八周笔记 进程的切换和系统的一般执行过程

  2、典型的Linux操作系统的架构

《Linux内核分析》第八周笔记 进程的切换和系统的一般执行过程

  3、最简单也是最复杂的操作——ls

《Linux内核分析》第八周笔记 进程的切换和系统的一般执行过程

  4、CPU和内存的角度看Linux系统的执行

《Linux内核分析》第八周笔记 进程的切换和系统的一般执行过程

  1. 执行gets()函数;
  2. 系统调用,陷入内核态,将eip/esp/cs/ds等信息压栈。
  3. 进程管理:等待键盘敲入指令。等待输入,CPU会调度其他进程执行,同时wait一个I/O中断;
  4. 敲击ls,发I/O中断给CPU,中断处理程序进行现场保存、压栈等等;
  5. 中断处理程序发现X进程在等待这个I/O(此时X已经变成阻塞态),处理程序将X设置为WAKE_UP;
  6. 进程管理可能会把进程X设置为next进程;
  7. gets()的系统调用就获得了从键盘上读取的数据,返回用户态。

从内存角度看,所有的物理地址都会被映射到3G以上的地址空间:因为这部分对所有进程来说都是共享的

0xc0000000以下是3G的部分,用户态。

《Linux内核分析》第八周笔记 进程的切换和系统的一般执行过程

 

 

五、实验

使用gdb跟踪分析一个schedule()函数 ,验证对Linux系统进程调度与进程切换过程的理解

《Linux内核分析》第八周笔记 进程的切换和系统的一般执行过程

 

《Linux内核分析》第八周笔记 进程的切换和系统的一般执行过程

 

关闭QEMU窗口,在shell窗口中,cd LinuxKernel回退到LinuxKernel目录,使用下面的命令启动内核并在CPU运行代码前停下以便调试:

qemu -kernel linux-3.18.6/arch/x86/boot/bzImage -initrd rootfs.img -s -S

接下来,我们就可以水平分割一个新的shell窗口出来,依次使用下面的命令启动gdb调试

gdb

(gdb) file linux-3.18.6/vmlinux

(gdb) target remote:1234

并在内核函数schedule的入口处设置断点,接下来输入c继续执行,则系统即可停在该函数处,接下来我们就可以使用命令n或者s逐步跟踪,可以详细浏览pick_next_task,switch_to等函数的执行过程

设置断点在schedule处:

《Linux内核分析》第八周笔记 进程的切换和系统的一般执行过程

《Linux内核分析》第八周笔记 进程的切换和系统的一般执行过程

六、总结

  通过学习,我们了解到Linux使用了堆栈进行了进程调度。schedule()在需要的时候重新获得大内核锁、重新启用内核抢占、并检查是否一些其他的进程已经设置了当前进程的tlf_need_resched标志,如果是,整个schedule()函数重新开始执行,否则,函数结束。linux调度的核心函数为schedule,schedule函数封装了内核调度的框架。细节实现上调用具体的调度类中的函数实现。当切换进程已经选好后,就开始用户虚拟空间的处理,然后就是进程的切换switch_to()。所谓进程的切换主要就是堆栈的切换,这是由宏操作switch_to()完成的。