操作系统是如何工作的
于佳心 原创作品转载请注明出处 《Linux内核分析》MOOC课程http://mooc.study.163.com/course/USTC-1000029000
本章所学内容主要围绕着三个方面。
1.函数调用堆栈
2.中断机制
3.mykernel上实际操作构建内核
操作系统的三个法宝指的是:存储程序计算机,函数调用堆栈,中断机制
其中函数调用堆栈是高级语言的起点,它的作用是记录调用路径和参数(调用框架,传递参数,保存返回地址,提供局部变量空间)
这里涉及到了esp,ebp两个相关寄存器,以及push、pop、call、ret寄存器,还有cs代码段寄存器及总是指向下一条指令地址的eip,这些内容在上一周的学习过程中都详细了解过了,所以在这里就不多讲了
我们还学到了调用框架的固定格式
建立框架:
pushl %ebp
movl %esp,%ebp
拆除框架:
movl %ebp,%esp
popl %ebp
ret
它们的中间便是call要调用的内容
关于另一个“法宝”——中断,我对它非常陌生。发生中断的原因是cpu内部做了工作,中断的出现来源于多道程序设计的出现,CPU把寄存器们压到一个叫内核的堆栈,把EIP指向中断处理程序的入口,保存现场。CPU和内核程序共同实现了保存现场和恢复现场。
课程中我们主要分析了周期性的时间中断,即内核时间片轮转。
另一个重要的东西是C代码中嵌入汇编代码——内嵌汇编语法
asm(
汇编语句模板;
输出部分;
输入部分;
破坏描述部分);
在前面如果需要可以加上volatile,这是指编译器不优化,后面的指令保持原样
在转移的过程中会遇到好多限定符,在此不详述。
操作系统除了“三大法宝”之外,还有“两把剑"——中断上下文切换和进程上下文切换
在试验中,输入要求的代码来运行初始程序
结果如下:
为何会出现这个结果呢?我们来看系统中的代码
我们可以看到图中有两个c程序,myinterrupt.c(时钟中断处理程序)和mymain.c(系统中唯一的一个进程)
我们先来看mymain.c中的内容
这个函数是操作系统的入口(在此之前的代码都是将操作系统初始化),每循环100000次,打印一个”my_start_kernel"。
再看myinterrupt.c
这是时间中断处理程序,每次时钟中断一次都调用一次上图的语句,在中断发生时进行中断处理动作
这是一个最简单直接的中断处理程序了,接下来我们来看一个更复杂的例子
mypcd.h
定义一个进程控制块
(程序中//的注释是自己加的,*/的注释是代码自带的,后面的代码都是)
/*
* linux/mykernel/mypcb.h
*
* Kernel internal PCB types
*
* Copyright (C) 2013 Mengning
*
*/ #define MAX_TASK_NUM 4
#define KERNEL_STACK_SIZE 1024*8 /* CPU-specific state of this task */
struct Thread { //Thread用于存储eip和esp
unsigned long ip;
unsigned long sp;
}; typedef struct PCB{
int pid; //pid:进程的状态
volatile long state; /* -1 unrunnable, 0 runnable, >0 stopped */
char stack[KERNEL_STACK_SIZE]; //定义内核堆栈
/* CPU-specific state of this task */
struct Thread thread;
unsigned long task_entry; //定义入口
struct PCB *next; //把进程用一个链表链起来
}tPCB; void my_schedule(void); //调度器
mymain.c
/*
* linux/mykernel/mymain.c
*
* Kernel internal my_start_kernel
*
* Copyright (C) 2013 Mengning
*
*/
#include <linux/types.h>
#include <linux/string.h>
#include <linux/ctype.h>
#include <linux/tty.h>
#include <linux/vmalloc.h> #include "mypcb.h" tPCB task[MAX_TASK_NUM]; //声明一个数组(task是数组)
tPCB * my_current_task = NULL; //声明当前task的一个指针
volatile int my_need_sched = ; //是否需要调度的标识 void my_process(void); void __init my_start_kernel(void) //初始化
{
int pid = ; //先初始化0号进程
int i;
/* Initialize process 0*/
task[pid].pid = pid;
task[pid].state = ;/* -1 unrunnable, 0 runnable, >0 stopped */ //状态:正在运行
task[pid].task_entry = task[pid].thread.ip = (unsigned long)my_process; //入口:my_process
task[pid].thread.sp = (unsigned long)&task[pid].stack[KERNEL_STACK_SIZE-]; //栈顶:之前定义的stack
task[pid].next = &task[pid]; //指向它自己
/*fork more process */ //初始化更多的进程
for(i=;i<MAX_TASK_NUM;i++) //共有MAX_TASK_NUM个进程
{
memcpy(&task[i],&task[],sizeof(tPCB)); //复制了0号进程的状态
task[i].pid = i;
task[i].state = -;
task[i].thread.sp = (unsigned long)&task[i].stack[KERNEL_STACK_SIZE-]; //每个进程都有自己的堆栈
task[i].next = task[i-].next; //指向下一个进程
task[i-].next = &task[i]; //将新进程加到进程列表的尾部
}
/* start process 0 by task[0] */
pid = ; //从0号进程开始运行
my_current_task = &task[pid];
asm volatile( //嵌入的汇编代码,构建了cpu的运行环境,0号进程设立的堆栈和0号 进程的入口
"movl %1,%%esp\n\t" /* set task[pid].thread.sp to esp */ //将第一号参数放入栈顶
"pushl %1\n\t" /* push ebp */ //pushl %ebp(现在栈是空的,esp==ebp)
"pushl %0\n\t" /* push task[pid].thread.ip */ //将eip压栈
"ret\n\t" /* pop task[pid].thread.ip to eip */ //pop eip,此后0号进程正式启动
"popl %%ebp\n\t"
:
: "c" (task[pid].thread.ip),"d" (task[pid].thread.sp) /* input c or d mean %ecx/%edx*/ //这里是第0号参数和第1号参数
);
}
void my_process(void) //有主动调度的机制
{
int i = ;
while()
{
i++;
if(i% == )
{
printk(KERN_NOTICE "this is process %d -\n",my_current_task->pid); //循环100000次有一次机会判断是否需要调度,调度完继续执行
if(my_need_sched == )
{
my_need_sched = ;
my_schedule();
}
printk(KERN_NOTICE "this is process %d +\n",my_current_task->pid);
}
}
}
myinterrupt.c
/*
* linux/mykernel/myinterrupt.c
*
* Kernel internal my_timer_handler
*
* Copyright (C) 2013 Mengning
*
*/
#include <linux/types.h>
#include <linux/string.h>
#include <linux/ctype.h>
#include <linux/tty.h>
#include <linux/vmalloc.h> #include "mypcb.h" extern tPCB task[MAX_TASK_NUM]; //全局变量
extern tPCB * my_current_task;
extern volatile int my_need_sched;
volatile int time_count = ; //时间计数 /*
* Called by timer interrupt.
* it runs in the name of current running process,
* so it use kernel stack of current running process
*/
void my_timer_handler(void)
{
#if 1
if(time_count% == && my_need_sched != )
{
printk(KERN_NOTICE ">>>my_timer_handler here<<<\n");
my_need_sched = ; //发现my_need_sched==1,就会调度一次,执行my_schedule
}
time_count ++ ;
#endif
return;
} void my_schedule(void)
{
tPCB * next;
tPCB * prev; if(my_current_task == NULL //出错处理,NULL说明有问题
|| my_current_task->next == NULL)
{
return;
}
printk(KERN_NOTICE ">>>my_schedule<<<\n");
/* schedule */
next = my_current_task->next; //将当前进程的下一个进程赋给next
prev = my_current_task; //将当前进程赋给prev
if(next->state == )/* -1 unrunnable, 0 runnable, >0 stopped */ //判定:如果下一个进程正在执行,就用下面的汇编代码切换进程
(进程间上下文的切换)
{
/* switch to next process */
asm volatile( //进程上下文切换的关键代码
"pushl %%ebp\n\t" /* save ebp */ //保存当前进程的ebp
"movl %%esp,%0\n\t" /* save esp */ //将当前进程的esp赋给0
"movl %2,%%esp\n\t" /* restore esp */ //将下一进程的esp放到esp里面
"movl $1f,%1\n\t" /* save eip */ //保存eip
"pushl %3\n\t" //push下一进程的eip
"ret\n\t" /* restore eip */ //下一个进程开始执行
"1:\t" /* next process start here */
"popl %%ebp\n\t"
: "=m" (prev->thread.sp),"=m" (prev->thread.ip) //0,1
: "m" (next->thread.sp),"m" (next->thread.ip) //2,3
);
my_current_task = next;
printk(KERN_NOTICE ">>>switch %d to %d<<<\n",prev->pid,next->pid);
}
else //这个进程是新的从未执行过
{
next->state = ; //置为运行时状态
my_current_task = next;
printk(KERN_NOTICE ">>>switch %d to %d<<<\n",prev->pid,next->pid);
/* switch to new process */
asm volatile(
"pushl %%ebp\n\t" /* save ebp */ //保存ebp
"movl %%esp,%0\n\t" /* save esp */ //保存esp在当前程序的esp里
"movl %2,%%esp\n\t" /* restore esp */ //将下一个进程的esp保存到esp里
"movl %2,%%ebp\n\t" /* restore ebp */ //将下一个进程的ebp保存到ebp里(栈是空的
"movl $1f,%1\n\t" /* save eip */ //将eip保存起来
"pushl %3\n\t" //将当前进程的入口保存起来
"ret\n\t" /* restore eip */
: "=m" (prev->thread.sp),"=m" (prev->thread.ip) //0,1
: "m" (next->thread.sp),"m" (next->thread.ip) //2,3
);
}
return;
}
总结:
操作系统是如何工作的:我认为,操作系统的工作离不开“三大法宝和”两把剑“
三大法宝中,存储程序计算机便是冯诺依曼体系结构,自不必说;函数调用堆栈记录了函数调用路径和参数,保存返回地址和临时需要用到的参数,提供局部变量空间;中断是为了多道程序设计的,当有多个程序需要执行时,每次执行的只能是一个程序,所以需要中断来调节,我们在这一章介绍的是时钟中断,即是否调用中断处理程序的判定是由时间来决定的,如果需要处理,CPU便将寄存器压入内核,将eip指向中断处理程序的入口。
两把剑中,中断上下文切换就是保护现场和恢复现场,而进程上下文的切换则决定了进程的执行顺序,在上面都有可执行的代码,所以就不仔细讲了
这一次学的东西比上一次难多了,比如说,那个分析代码的视频我就看了至少三遍才懂,而且也并没有完全理解透彻,想到以后的课程也许会更难,有点害怕。
学校网不好,实验楼总是卡,但是如果用自己的虚拟机调配环境可能也要花好长时间,所以就非常缓慢的做了实验,其实感觉实验只是对所学课程的一个复习,这样挺好的,可以发现一些自己以为会了的东西其实不会。
没什么可说的了,求大家高抬贵手。