《Linux内核分析》 第四节 扒开系统调用的三层皮(上)

时间:2023-12-12 09:06:02

《Linux内核分析》 第四节 扒开系统调用的三层皮(上)


张嘉琪 原创作品转载请注明出处 《Linux内核分析》MOOC课程http://mooc.study.163.com/course/USTC-1000029000

一、用户态、内核态和中断

1.用户态、内核态和中断的处理过程

  • 一般现代CPU都有几种不同的指令执行级别。

  • 在高执行级别下,代码可以执行特权指令,访问任意的物理地址,这种CPU执行级别就对应着内核态。 而在相应的低级别执行状态下,代码的掌控范围会受到限制。只能在对应级别允许的范围内活动。

  • 举例:Intel x86CPU有四种不同的执行级别0-3,Linux只使用了其中的0 3级分别表示内核态和用户态

  • 为什么有权限级别的划分?

    是为了让操作系统本身更稳定的一种机制

  • cs寄存器的最低两位表明了当前代码的特权级。

  • CPU每条指令的读取都是通过cs:eip这两个寄存器:其中cs是代码段选择寄存器,eip是偏移量寄存器。

  • 上述判断由硬件完成。

  • 一般来说在Linux中,地址空间是一个显著地标志:0xc0000000以上的地址空间只能在内核态下访问,都可以访问0x00000000-0xbfffffff的地址空间在两种状态下。

    注意:这里说的地址空间是逻辑地址而不是物理地址。

  • 中断处理是是从用户态进入内核态的主要方式。

  • 系统调用只是一种特殊的中断。

  • 寄存器上下文

    • 从用户态切换到内核态时

      • 必须要保存用户态的寄存器上下文。
  • 中断/int指令会在堆栈上保存一些寄存器的值

    • 如:用户态栈顶地址、当时的状态字、当时的cs:eip的值。
  • 中断发生后的第一件事就是保存现场,结束前最后一件事是恢复现场

    • 保护现场就是进入中断程序 保存需要用到的寄存器的数据。

    • 恢复现场就是推出中断程序 恢复保存寄存器的数据。

  • 中断处理的完整过程

    • interrupt(ex:int 0x80)-save

      cs:eip/ss:esp/eflag(curret) to kernel stack,then load cs:eip(entry of a specific ISR)and ss:esp(point to kernel stack)

    • SAVE_ALL

      • ...//内核代码,完成中断服务,发生进程调度
    • RESTORE_ALL

    • iret-pop cs:eip/ss:esp/eflags from kernel stack

二、系统调用概述

《Linux内核分析》 第四节 扒开系统调用的三层皮(上)

《Linux内核分析》 第四节 扒开系统调用的三层皮(上)

《Linux内核分析》 第四节 扒开系统调用的三层皮(上)

  • 应用程序、封装例程、系统调用处理程序及系统调用服务例程之间的关系

《Linux内核分析》 第四节 扒开系统调用的三层皮(上)

《Linux内核分析》 第四节 扒开系统调用的三层皮(上)

三、使用库函数API和C代码中嵌入汇编代码两种方式使用同一个系统调用

  • 实验报告

  • 选择一个系统调用(13号系统调用time除外),系统调用列表参见http://codelab.shiyanlou.com/xref/linux-3.18.6/arch/x86/syscalls/syscall_32.tbl 参考视频中的方式使用库函数API和C代码中嵌入汇编代码两种方式使用同一个系统调用

  • 博客内容的具体要求如下:

    1. 题目自拟,内容围绕系统调用的工作机制进行,博客中需要使用实验截图

    2. 博客内容中需要仔细分析汇编代码调用系统调用的工作过程,特别是参数的传递的方式等。

    3. 总结部分需要阐明自己对“系统调用的工作机制”的理解。
  • 本次实验选择了2号调用fork调用来做实验:fork函数执行完毕后,如果创建新进程成功,则出现两个进程,一个是子进程,一个是父进程。在子进程中,fork函数返回0,在父进程中,fork返回新创建子进程的进程ID

用实验楼的虚拟机打开shell

Cd Code
Vi forktest.c
Gcc forktest.c -o forktest.o -m32
./forktest.o

fork.c代码如下

#include <unistd.h>
#include <stdio.h>
int main ()
{
pid_t fpid;
int count = ;
fpid = fork();
if (fpid < )
printf("error in fork!");
else if (fpid == ) {
printf("i am the child process, my process id is %d\n",getpid());
count++;
}
else {
printf("i am the parent process, my process id is %d\n",getpid());
count++;
}
printf("count: %d\n",count);
return ;
}

 运行结果见截图 

《Linux内核分析》 第四节 扒开系统调用的三层皮(上)

《Linux内核分析》 第四节 扒开系统调用的三层皮(上)

  • 嵌入式汇编代码的执行,fork-asm.c源代码如下(参数的传递方式见注释):
#include <unistd.h>
#include <stdio.h>
int main ()
{
pid_t fpid;
int count = ;
asm volatile (
"mov $0, %%ebx\n\t"
"mov $0x2, %%eax\n\t" // 将fork的系统调用号0x2赋值给eax
"int $0x80\n\t" // 通过0x80中断向量,执行系统调用
"mov %%eax, %0\n\t" // 系统返回的pid号默认储存在eax中
: "=m" (fpid) // 输出操作数0为内存中的fpid。
);
if (fpid < ) printf("error in fork!"); else if (fpid == ) { printf("i am the child process, my process id is %d\n",getpid()); count++; } else { printf("i am the parent process, my process id is %d\n",getpid()); count++; } printf("count: %d\n",count); return ; }

运行结果见截图

《Linux内核分析》 第四节 扒开系统调用的三层皮(上)

总结

调用一个系统调用经历了系统调用的三层皮。分别是系统调用函数api,中断向量systemcall,系统调用服务sysxyz。通过C嵌入汇编代码的实验可以比较清晰的了解系统调用过程。

 // 系统调用号默认通过eax传递,因此将fork的系统调用号0x2赋值给eax