罗晓波+ 原创作品转载请注明出处 + 《Linux内核分析》MOOC课程http://mooc.study.163.com/course/USTC-1000029000
本文将通过一段精简的linux内核代码,mykernel代码,从进程的启动到进程的切换之间发生了什么,cpu和操作系统做了什么,简单地聊一下,首先,从一个实验开始吧!
1.Mykernel精简内核程序实验
1.1 实验环境:
实验环境依旧是由实验楼为我们提供的,感兴趣的读者可以试着做一下这个实验,链接是:Mykernel精简内核程序实验。
1.2 实验过程:
首先用下面两条命令,
cd LinuxKernel/linux-3.9.4 qemu -kernel arch/x86/boot/bzImage
以上的实验环境仅仅是模拟了时钟中断,一直都是一个进程的run~,接下来,加入下面的代码,即将开始进程切换调度啦!
需要在mykernel下重新更新下面文件,给出链接:myinterrupt.c、mymain.c、mypcb.h
简单介绍一下,上面三个文件的作用,下文中会较为详细的描述其中的核心代码。myinterrupt.c,主要负责中断以及进程切换;mymain.c,初始化系统环境,mypcb.h描述了进程控制块的定义。
再次到Linux3.9.4目录下重新编译,用下面命令:
make allnoconfig make qemu -kernel arch/x86/boot/bzImage上图~
2.进程的启动和进程的切换机制
2.1 进程启动:
进程从void __init my_start_kernel(void)开始启动,直接上代码吧~
void __init my_start_kernel(void) { int pid = 0; int i; /* Initialize process 0*/ task[pid].pid = pid; task[pid].state = 0;/* -1 unrunnable, 0 runnable, >0 stopped */ task[pid].task_entry = task[pid].thread.ip = (unsigned long)my_process; task[pid].thread.sp = (unsigned long)&task[pid].stack[KERNEL_STACK_SIZE-1]; task[pid].next = &task[pid]; /*fork more process */ for(i=1;i<MAX_TASK_NUM;i++) { memcpy(&task[i],&task[0],sizeof(tPCB)); task[i].pid = i; task[i].state = -1; task[i].thread.sp = (unsigned long)&task[i].stack[KERNEL_STACK_SIZE-1]; task[i].next = task[i-1].next; task[i-1].next = &task[i]; } /* start process 0 by task[0] */ pid = 0; my_current_task = &task[pid]; asm volatile( "movl %1,%%esp\n\t" /* set task[pid].thread.sp to esp */ "pushl %1\n\t" /* push ebp */ "pushl %0\n\t" /* push task[pid].thread.ip */ "ret\n\t" /* pop task[pid].thread.ip to eip */ "popl %%ebp\n\t" : : "c" (task[pid].thread.ip),"d" (task[pid].thread.sp) /* input c or d mean %ecx/%edx*/ ); }函数前面是一些初始化工作,包括对于进程的fork,在这里精简的只是mencpy了,也就是说,每个进程初始时,除了pid之外,对于所定义的pcb来说,其他都是相同的,以一个链表来组织各进程。
下面一段嵌入式汇编代码值得注意,该段代码的主要作用就是初始化第0号进程,将0号进程的esp写入esp寄存器,由于进程还未开始执行,所以说进程的esp以及ebp都应该是指向栈底的(空栈),另外,0号进程的eip在这里已经指向了my_process代码段地址,ret之后,开始执行0号进程。
2.2 进程切换:
同linux内核一样,mykernel精简版本的的进程切换也是通过schedule()函数进行进程切换,挡发生时钟中断的时候,中断处理程序会将需要调度的flag置为1,而与此同时,每一个当前执行的进程都在轮询,如果一旦flag被置为了1,则开始进行进程切换,代码在上述链接都有,在myinterrupt.c文件,接下来重点分析一下,切换进程的核心代码:
case1: 进程开始切换的时候,是切换到一个进程状态为已经在运行的进程。
if(next->state == 0)/* -1 unrunnable, 0 runnable, >0 stopped */ { /* switch to next process */ asm volatile( "pushl %%ebp\n\t" /* save ebp */ "movl %%esp,%0\n\t" /* save esp */ "movl %2,%%esp\n\t" /* restore esp */ "movl $1f,%1\n\t" /* save eip */ "pushl %3\n\t" "ret\n\t" /* restore eip */ "1:\t" /* next process start here */ "popl %%ebp\n\t" : "=m" (prev->thread.sp),"=m" (prev->thread.ip) : "m" (next->thread.sp),"m" (next->thread.ip) ); my_current_task = next; printk(KERN_NOTICE ">>>switch %d to %d<<<\n",prev->pid,next->pid); }以最简单的方式来理解上面这段进程切换的代码,假如初始化的时候,只初始化了两个进程,即0,1号进程,也就是说,假如只有这两个进程在来回切换,来画出他们的堆栈吧~
prev为p0;next为p1:
嵌入式汇编代码第一句就是将prev进程的ebp压入内核栈中,接下来保存prev的esp到prev->thread.sp中,thread字段是保存大部分的寄存器,这里将esp存入thread的sp字段。
在切换进程之前,将1f存到prev的eip中,1f指的是被标记为1的地址,ret之后,弹栈next的eip,开始执行next进程。
其实,不管有多少个进程在切换,当再次调度回来的时候,esp指针从从当前的next(之前的prev)中获得,执行到标记为1的地方,然后弹栈,顺着esp指针弹栈,刚好,此刻弹出的就是之前prev的ebp指针,进程得以继续执行。
case2:进程切换到一个新进程
先上代码:
else { next->state = 0; my_current_task = next; printk(KERN_NOTICE ">>>switch %d to %d<<<\n",prev->pid,next->pid); /* switch to new process */ asm volatile( "pushl %%ebp\n\t" /* save ebp */ "movl %%esp,%0\n\t" /* save esp */ "movl %2,%%esp\n\t" /* restore esp */ "movl %2,%%ebp\n\t" /* restore ebp */ "movl $1f,%1\n\t" /* save eip */ "pushl %3\n\t" "ret\n\t" /* restore eip */ : "=m" (prev->thread.sp),"=m" (prev->thread.ip) : "m" (next->thread.sp),"m" (next->thread.ip) ); }重点看其中的汇编代码,前面的几句和case1相同,由于这里所切换的进程是一个新进程,所以这里的state置为0(running状态),这里的movl $1f,%1\n\t中的1f在进程再次调度回来的时候,走的是case1的分支代码块,所以case2中的 中没有标记为1的代码块,也没有pop ebp的操作。
3.对操作系统如何工作的简单理解:
上面实验所述的是一个精简的mykernel代码,但是OS对于进程的启动以及切换也都是有一定相似性的,但是真正的linux内核考虑的东西远比这个mykernel多得多,但是都是从一个初始化上下文环境的函数开始执行,即start_kernel函数,创建很多进程或者fork若干进程,当中断发生的时候,如mykernel中就是时钟中断发生之后,接下来OS就会为各进程进行调度,在调度队列中选取出一个适合的进程,由CPU和内核堆栈保存前一个进程的各寄存器信息(进程描述块中的thread结构体保存大部分CPU寄存器,但是诸如eax、ebx等等这些通用寄存器是保存在内和堆栈中的),将eip指向要调度的进程执行的地址,开始执行。