《Linux内核设计与实现》Chapter 5 读书笔记

时间:2022-05-02 18:38:20

《Linux内核设计与实现》Chapter 5 读书笔记

在现代操作系统中,内核提供了用户进程与内核进行交互的一组接口,这些接口的作用是:

  • 使应用程序受限地访问硬件设备
  • 提供创建新进程与已有进程进行通信的机制
  • 提供申请操作系统其他资源的能力

一、与内核通信

1、系统调用的作用

系统调用在用户空间进程和硬件设备之间添加了一个中间层,作用是:

  1. 为用户空间提供了一种硬件抽象接口;
  2. 系统调用保证了系统的稳定和安全,即可以避免应用程序不正确地使用硬件设备,窃取其他进程的资源;
  3. 每个进程都运行在虚拟系统中,而在用户空间和系统的其余部分提供这样一层公共接口。

二、API、POSIX和C库

一般,应用程序通过在用户空间实现的应用编程接口(API)来编程。

API可以在各种不同的操作系统实现,给应用程序提供完全相同的接口,而它们本身在这些系统上的实现却可能迥异。

在Unix世界中,最流行的应用编程接口是基于POSIX标准的。POSIX标准是仿照早期Unix系统的接口建立的。

C库实现了Unix系统的主要API。此外,C库还提供了POSIX的大部分API。

C库包括:

  1. 标准C库函数
  2. 系统调用接口

三、系统调用

要访问系统调用,通常通过C库中定义的函数调用来进行。

通常,用负的返回值表明错误。用0返回值表示成功。

系统调用在出现错误的时候C库会把错误码写入errno全局变量。通过调用perror()库函数,可以把该变量翻译成用户可以理解的错误字符串。

SYSCALL_DEFINE0只是一个宏,它定义一个无参数的系统调用,代码如下:

   $  asmlinkage long sys_getpid(void)

asmlinkage是一个编译指令

函数返回long,以保证32位64位系统的兼容

1、系统调用号

Linux中,每个系统调用被赋予一个系统调用号

  1.系统调用号一旦分配就不能再有任何变更。

  • 如果一个系统调用被删除,它所占用的系统调用号也不允许被回收利用。
  • Linux有一个“未实现”系统调用sysnisyscall(),它除了返回―ENOSYS外不做任何其他工作,这个错误号就是专门针对无效的系统调用而设的

  2.内核记录了系统调用表中的所有已注册过的系统调用的列表,存储在syscalltable中。

2、系统调用的性能

Linux系统调用比其他操作系统快得多:

  • Linux上下文切换时间很短
  • 系统调用处理程序和每个系统调用本身很简洁

四、系统调用处理程序

用户空间的程序不能直接调用内核空间中的函数,它是以软中断的方式通知内核。

x86系统上预定义的软中断的中断号是128,通过int $0x80指令触发

1、指定恰当的系统调用

  1. 在x86上,系统调用号是通过eax寄存器传递给内核的。
  2. system_call()函数通过将给定的系统调用号与NR_syscall做比较来检查其有效性。

2、参数传递

  1. 发生陷入时,应将参数从用户空间传给内核。
  2. 在x86-32系统上,ebx、ecx、edx、esi、edi按照顺序放前五个参数

五、系统调用的实现

1、实现系统调用

  系统调用提供机制而不是策略

2、参数验证

  1.最重要的检查:用户提供的指针是否有效。

  2.在接受一个用户间的指针之前,内核必须保证:

  • 指针指向的内存区域属于用户空间。
  • 指针指向的内存区域在进程的地址空间里
  • 进程决不能绕过内存访问限制。

  3.两个方法检查在两空间之间数据的来回拷贝

  • 向用户空间写入数据——copy_to_user();
  • 从用户空间读取数据——copy_from_user()。
    成功:返回0;
    失败:返回标准-EFAULT

注意:以上两种办法可能会引起阻塞,当用户数据的页被换出到硬盘上而不在物理内存上,进程会休眠,直至被换回物理内存。

六、系统调用上下文

  • 内核在执行系统调用时处于进程上下文;
  • current指针指向当前任务,即引发系统调用的那个进程;
  • 在进程上下文中,内核可以休眠并且可以被抢占;
  • 当系统调用返回时system_call()会负责切换到用户空间并让用户继续执行下去。

1 .绑定一个系统调用的最后步骤

当编写完一个系统调用后,把它注册成一个正式的系统调用是件琐碎的工作:

  • 首先,在系统调用表的最后加入一个表项。
  • 对于所支持的各种体系结构,系统调用号都必须定义于<asm/unistd.h>中。
  • 系统调用必须被编译进内核映象(不能被编译成模块)。比如sys.c,它包含了各种各样的系统调用。

2.从用户空间访问系统调用

  • Linux提供一组宏:_syscalln()(n的范围:0到6,代表传递给系统调用的参数个数)

3.为什么不通过系统调用的方式实现

建立一个新的系统调用的好处:

  • 系统调用创建容易且使用方便。
  • Linux系统调用的高性能显而易见。

问题是:

  • 你需要―个系统调用号,而这需要一个内核在处于开发版本的时候由官方分配给你。
  • 系统调用被加入稳定内核后就被固化了,它的接口不允许做改动。
  • 需要将系统调用分别注册到每个需要支持的体系结构中去。
  • 在脚本中不容易调用系统调用,也不能从文件系统直接访问系统调用。
  • 由于你需要系统调用号,因此在主内核树之外是很难维护和使用系统调用的。

替代方法:

实现一个设备节点,并对此实现read()和write()。使用特定的信息进行检索。

  • 像信号量这样的某些接口,可以用文件描述符来表示,因此也就可以按上述方式对其进行操作。
  • 把增加的信息作为一个文件放在sysfs的合适位置。

七、小结

1、系统调用到底是什么。
2、Linux内核如何实现系统调用
3、执行系统调用的连锁反应:

  • 陷入内核
  • 传递系统调用号和参数
  • 执行正确的系统调用函数
  • 并把返回值带回用户空间。