通过一段精简的进程切换代码,聊一下OS是如何工作

时间:2023-01-15 14:25:24

罗晓波+ 原创作品转载请注明出处 + 《Linux内核分析》MOOC课程http://mooc.study.163.com/course/USTC-1000029000 

本文将通过一段精简的linux内核代码,mykernel代码,从进程的启动到进程的切换之间发生了什么,cpu和操作系统做了什么,简单地聊一下,首先,从一个实验开始吧!

1.Mykernel精简内核程序实验

1.1 实验环境:

实验环境依旧是由实验楼为我们提供的,感兴趣的读者可以试着做一下这个实验,链接是:Mykernel精简内核程序实验

1.2 实验过程:

首先用下面两条命令,

cd LinuxKernel/linux-3.9.4
qemu -kernel arch/x86/boot/bzImage
通过一段精简的进程切换代码,聊一下OS是如何工作
以上的实验环境仅仅是模拟了时钟中断,一直都是一个进程的run~,接下来,加入下面的代码,即将开始进程切换调度啦!

需要在mykernel下重新更新下面文件,给出链接:myinterrupt.cmymain.cmypcb.h

简单介绍一下,上面三个文件的作用,下文中会较为详细的描述其中的核心代码。myinterrupt.c,主要负责中断以及进程切换;mymain.c,初始化系统环境,mypcb.h描述了进程控制块的定义。

再次到Linux3.9.4目录下重新编译,用下面命令:

make allnoconfig
make
qemu -kernel arch/x86/boot/bzImage
上图~

通过一段精简的进程切换代码,聊一下OS是如何工作

通过一段精简的进程切换代码,聊一下OS是如何工作
通过上面两张图,可以发现进程的切换。下面分析一下咯。

2.进程的启动和进程的切换机制

2.1 进程启动:

进程从void __init my_start_kernel(void)开始启动,直接上代码吧~

void __init my_start_kernel(void)
{
    int pid = 0;
    int i;
    /* Initialize process 0*/
    task[pid].pid = pid;
    task[pid].state = 0;/* -1 unrunnable, 0 runnable, >0 stopped */
    task[pid].task_entry = task[pid].thread.ip = (unsigned long)my_process;
    task[pid].thread.sp = (unsigned long)&task[pid].stack[KERNEL_STACK_SIZE-1];
    task[pid].next = &task[pid];
    /*fork more process */
    for(i=1;i<MAX_TASK_NUM;i++)
    {
        memcpy(&task[i],&task[0],sizeof(tPCB));
        task[i].pid = i;
        task[i].state = -1;
        task[i].thread.sp = (unsigned long)&task[i].stack[KERNEL_STACK_SIZE-1];
        task[i].next = task[i-1].next;
        task[i-1].next = &task[i];
    }
    /* start process 0 by task[0] */
    pid = 0;
    my_current_task = &task[pid];
	asm volatile(
    	"movl %1,%%esp\n\t" 	/* set task[pid].thread.sp to esp */
    	"pushl %1\n\t" 	        /* push ebp */
    	"pushl %0\n\t" 	        /* push task[pid].thread.ip */
    	"ret\n\t" 	            /* pop task[pid].thread.ip to eip */
    	"popl %%ebp\n\t"
    	: 
    	: "c" (task[pid].thread.ip),"d" (task[pid].thread.sp)	/* input c or d mean %ecx/%edx*/
	);
}   
函数前面是一些初始化工作,包括对于进程的fork,在这里精简的只是mencpy了,也就是说,每个进程初始时,除了pid之外,对于所定义的pcb来说,其他都是相同的,以一个链表来组织各进程。

下面一段嵌入式汇编代码值得注意,该段代码的主要作用就是初始化第0号进程,将0号进程的esp写入esp寄存器,由于进程还未开始执行,所以说进程的esp以及ebp都应该是指向栈底的(空栈),另外,0号进程的eip在这里已经指向了my_process代码段地址,ret之后,开始执行0号进程。

2.2 进程切换:

同linux内核一样,mykernel精简版本的的进程切换也是通过schedule()函数进行进程切换,挡发生时钟中断的时候,中断处理程序会将需要调度的flag置为1,而与此同时,每一个当前执行的进程都在轮询,如果一旦flag被置为了1,则开始进行进程切换,代码在上述链接都有,在myinterrupt.c文件,接下来重点分析一下,切换进程的核心代码:

case1: 进程开始切换的时候,是切换到一个进程状态为已经在运行的进程。

 if(next->state == 0)/* -1 unrunnable, 0 runnable, >0 stopped */
    {
    	/* switch to next process */
    	asm volatile(	
        	"pushl %%ebp\n\t" 	    /* save ebp */
        	"movl %%esp,%0\n\t" 	/* save esp */
        	"movl %2,%%esp\n\t"     /* restore  esp */
        	"movl $1f,%1\n\t"       /* save eip */	
        	"pushl %3\n\t" 
        	"ret\n\t" 	            /* restore  eip */
        	"1:\t"                  /* next process start here */
        	"popl %%ebp\n\t"
        	: "=m" (prev->thread.sp),"=m" (prev->thread.ip)
        	: "m" (next->thread.sp),"m" (next->thread.ip)
    	); 
    	my_current_task = next; 
    	printk(KERN_NOTICE ">>>switch %d to %d<<<\n",prev->pid,next->pid);   	
    }
以最简单的方式来理解上面这段进程切换的代码,假如初始化的时候,只初始化了两个进程,即0,1号进程,也就是说,假如只有这两个进程在来回切换,来画出他们的堆栈吧~

prev为p0;next为p1:

嵌入式汇编代码第一句就是将prev进程的ebp压入内核栈中,接下来保存prev的esp到prev->thread.sp中,thread字段是保存大部分的寄存器,这里将esp存入thread的sp字段。

通过一段精简的进程切换代码,聊一下OS是如何工作通过一段精简的进程切换代码,聊一下OS是如何工作

在切换进程之前,将1f存到prev的eip中,1f指的是被标记为1的地址,ret之后,弹栈next的eip,开始执行next进程。

其实,不管有多少个进程在切换,当再次调度回来的时候,esp指针从从当前的next(之前的prev)中获得,执行到标记为1的地方,然后弹栈,顺着esp指针弹栈,刚好,此刻弹出的就是之前prev的ebp指针,进程得以继续执行。

case2:进程切换到一个新进程

先上代码:

else
    {
        next->state = 0;
        my_current_task = next;
        printk(KERN_NOTICE ">>>switch %d to %d<<<\n",prev->pid,next->pid);
    	/* switch to new process */
    	asm volatile(	
        	"pushl %%ebp\n\t" 	    /* save ebp */
        	"movl %%esp,%0\n\t" 	/* save esp */
        	"movl %2,%%esp\n\t"     /* restore  esp */
        	"movl %2,%%ebp\n\t"     /* restore  ebp */
        	"movl $1f,%1\n\t"       /* save eip */	
        	"pushl %3\n\t" 
        	"ret\n\t" 	            /* restore  eip */
        	: "=m" (prev->thread.sp),"=m" (prev->thread.ip)
        	: "m" (next->thread.sp),"m" (next->thread.ip)
    	);          
    }   
重点看其中的汇编代码,前面的几句和case1相同,由于这里所切换的进程是一个新进程,所以这里的state置为0(running状态),这里的movl $1f,%1\n\t中的1f在进程再次调度回来的时候,走的是case1的分支代码块,所以case2中的 中没有标记为1的代码块,也没有pop ebp的操作。

3.对操作系统如何工作的简单理解:

上面实验所述的是一个精简的mykernel代码,但是OS对于进程的启动以及切换也都是有一定相似性的,但是真正的linux内核考虑的东西远比这个mykernel多得多,但是都是从一个初始化上下文环境的函数开始执行,即start_kernel函数,创建很多进程或者fork若干进程,当中断发生的时候,如mykernel中就是时钟中断发生之后,接下来OS就会为各进程进行调度,在调度队列中选取出一个适合的进程,由CPU和内核堆栈保存前一个进程的各寄存器信息(进程描述块中的thread结构体保存大部分CPU寄存器,但是诸如eax、ebx等等这些通用寄存器是保存在内和堆栈中的),将eip指向要调度的进程执行的地址,开始执行。