Linux内核分析第五章读书笔记

时间:2022-05-11 21:30:01

第五章 系统调用

在操作系统中,内核提供了用户进程与内核进行交互的一组接口,这些接口在应用程序和内核之间扮演了使者的角色,保证系统稳定可靠,避免应用程序肆意妄行。

5.1 与内核通信

系统调用在用户空间进程和硬件设备之间添加一个中间层,该层有三个作用:

  1. 为用户空间提供了一种硬件的抽象接口
  2. 系统调用保证了系统的稳定和安全,对需要进行的访问进行裁决
  3. 系统调用是用户空间访问内核的唯一手段,除异常和陷入外,它们是内核唯一的合法入口

5.2 API、POSIX和C库

应用程序通过在用户空间实现的应用编程接口(API)来编程

在UNIX中,最流行的应用编程接口是基于POSIX标准的,目标:提供一套大体基于Unix的可移植操作系统标准

Linux的系统调用作为C库的一部分,C库提供了POSIX的大部分API

程序员àAPI   内核à系统调用

Unix的系统调用抽象出了用于完成某种确定的目的函数,但函数怎么用并不在它的管辖范围,所谓“提供机制而不是策略”。(机制:需要提供什么功能;策略:怎样实现这些功能)

5.3 系统调用

访问系统调用通过C库中定义的函数调用来进行。

系统调用通过一个long型返回值表示成功或错误,通常(不绝对),一个负的返回值表示错误,0值表示成功。出现错误时C库会把错误码写入errno全局变量,通过调用perror()库函数翻译成用户可以理解的错误字符串

下面举一个例子

SYSCALL_DEFINE0(getpid)
{
return task_tgit_vnr(current);//returns current->tgid
}

其中SYSCALL_DEFINE0是一个宏,由于后面写着0,所以它定义的是一个无参数的系统调用

展开:

asmlinkage long sys_getpid(void)

asmlinkage限定词,是一个编译指令,通知编译器仅从栈中提取该函数的参数,所有系统调用都需要这个限定词

为了保证32位和64位兼容,系统调用在用户空间和内核空间有不同的返回值类型,在用户空间为int,在内核空间为long

get_pid()在内核中被定义为sys_getpid(),这也是所有系统调用都要遵循的命名规则

5.3.1 系统调用号

系统调用号一旦分配就不能再变更,系统调用被删除也不允许回收利用

sys_ni_syscall():“未实行”系统调用,唯一的工作是返回-ENOSYS,专门针对无效的系统调用,用了“填补空缺”

内核记录了系统调用表中所有已注册过的列表,存储于sys_call_table中,每个体系结构都明确的定义了这个表,在x86-64中,它定义于arch/i386/kernel/syscall_64.c文件中,为每一个有效的系统调用指定了唯一的系统调用号。

5.3.2 系统调用的性能

Linux系统调用比其他的快。

原因:Linux切换上下文时间很短,系统调用处理程序和每一个系统调用本身都很简洁。

5.4 系统调用处理程序

通知内核:通过引发一个异常来促使系统切换到内核态去执行异常处理程序,也就是系统调用处理程序,名为system_call,中断号128,通过int$0x80指令触发。

最近x86增加了sysenter指令,更快更专业。

5.4.1 指定恰当的系统调用

仅仅陷入内核不够,必须把系统调用号一并传给内核,x86中,通过eax寄存器传递

system_call将系统调用号与NR_syscalls,如果大于等于,返回-ENOSYS,否则,执行:

call *sys_call_table(,%rax,)

5.4.2 参数传递

ebx、ecx、edx、esi、edi按顺序存放前五个参数,用一个单独的寄存器存放指向这些参数的用户空间地址的指针

返回值存放在eax寄存器

5.5 系统调用的实现

5.5.1 实现系统调用

第一步:决定它的用途

接口要简洁,参数尽量少,越通用越好。

很多系统调用提供了标志参数以确保向前兼容,目的:即使增加新的功能和选项,也不破坏向后兼容或不需要增加新的系统调用

注意:可移植性、健壮性、为将来做打算

5.5.2 参数验证

检查参数是否合法,最重要的是检查用户提供的指针是否有效

内核必须保证:

1.指针指向的内存区域属于用户空间,进程决不能哄骗内核去读内核空间的数据

2.指针指向的内存区域在进程的地址空间里,进程决不能哄骗内核去读其他程序的数据

3.进程决不能绕过内存访问限制(可读、可写、可执行)

内核无论何时都不能轻率接受来自用户空间的指针

copy_to_user():向用户空间写入数据

copy_from_user():从用户空间读取数据

三个参数:进程空间中的目的内存地址,内核空间内的源地址,需要拷贝的数据长度

执行失败,返回数据字节数,成功返回0,错误返回标准-EFAULT

这两个函数都有可能引起阻塞

最后一项检查是否有合法权限,使用capable()函数检查是否有权能对指定的资源进行操作,返回非0值,有权进行操作,返回0,无权操作

5.6 系统调用上下文

内核在执行系统调用时处于进程上下文,current指针指向当前任务,即引发系统调用的那个进程

在进程上下文中,内核可以休眠,可以被抢占。

可以休眠说明系统调用可以使用内核提供的绝大部分功能(中断处理程序不能休眠,操作受到了极大限制)

当前进程可以被其他进程抢占,必须保证该系统调用是可重入的

当系统调用返回时,控制权扔在system_call()中,它最终负责切换到用户空间

5.6.1 绑定一个系统调用的最后步骤

以系统调用foo()为例

1.在系统调用表的最后加入一个表项,从0开始算起,系统调用在该表的位置就是它的系统调用号

打开entry.s文件中的系统调用表,在表尾加入:

.long sys_foo     /* 338 */

对于每种需要支持的体系结构,都必须将自己的系统调用加入到其系统调用表中,每种体系结构不需要对于相同的系统调用号

系统调用号是专属于体系结构ABI(应用程序二进制接口)的部分。

2.系统调用号必须定义于<asm/unistd.h>中

在列表中加入:

#define __NR_foo            338

3.系统调用必须被编译进内核映像(不能编译成模块),把它放进kernel下得一个相关文件

将其放进kernel/sys.c:

#include <asm/page.h>
asmlinkage long sys_foo(void)
{
return THREAD_size;
}

5.6.2 从用户空间访问系统调用

系统调用靠C库支持,用户程序通过包含标准头文件并和C库链接,就可以使用系统调用

_syscalln():Linux本身提供的一组宏,用于直接对系统调用进行访问,它会设置好寄存器并调用陷入指令,n的范围从0到6,代表参数个数

举个例子:

long open(const char *filename, int flags, int mode)

宏的形式:

#define NR_open      5
_syscall3(long,open,const char*,filename,int,flags,int,mode)

每个宏都有2+2*n个参数,第一个参数对应系统调用的返回值类型,第二个参数对应着系统调用的名称

该宏会被扩展成内嵌汇编的C函数,将系统调用号和参数压入寄存器并触发软中断来陷入内核

5.6.3 为什么不通过系统调用的方式实现

建立一个系统调用的好处:

1.系统调用创建容易使用方便

2.Linux系统调用性能高

但是有好多好多问题

替代方法:

实现一个设备节点,并对此实现read()和write(),使用ioctl()对特定的设置进行操作,或对特定的信息进行检索

1.信号量之类的接口,可以用文件描述符表示

2.把增加的信息作为文件放在sysfs的合适位置

Linux尽量避免每出现一个新的抽象就简单的加入一个新的系统调用,这体现了Linux是一个相对较为稳定并且功能以及比较完善的操作系统。