目录
一、信号的概念
二、信号在进程的pcb中的数据结构
三、信号的捕获处理函数
(1)signal
(2)sigaction
四、信号集函数
(1)数据类型sigset_t及其位操作
(2) sigprocmask函数修改block位图
(3)sigpending函数读取pending位图
五、信号的捕获
六、SIGCHILD信号
一、信号的概念
信号是进程间通信的一种,是进程之间事件异步通知的一种方式,属于软中断。但是又和我们之前了解的System V通信方式不太一样,信号仅仅只是为了对一个进程发通知,并不能向之前的通信方式一样传递数据和内容等。
好比我们生活中的红绿灯,红绿灯在变化之前,我们就知道红灯停绿灯行。信号也如此,在一个进程接收到信号之前,他的pcb结构对象中就会有一张函数指针表来表示即使我目前还没有收到信号,但是对于信号我们进程要产生什么动作是已知的。
然后有时候进程在执行更为重要的事情,还不能及时处理信号,所以进程pcb中还会有一个位图来暂时保存信号。直到合适的时机,再去处理该信号。
二、信号在进程的pcb中的数据结构
也就是说,信号产生之后,由操作系统把信号写到对应进程的task_struct中的pending位图中,这个表示信号的未决(即信号已经产生了,而且我进程已经捕获到了该信号)。
至于block位图,则是表示信号的阻塞,即进程的pending位图捕获到信号后,不往后处理,而是阻塞在pending位图中,直到该信号不再被阻塞,才开始处理该信号。
信号从位图中拿出来去处理该信号,我们称之为信号的抵达,即第三个数据结构handler,它是一张函数指针的数组,里面保存了不同信号的处理方式,如SIG_DFL表示默认处理,SIG_IGN表示忽略处理,如果我们自己修改了handler中的参数,则表示自定义处理。
SIGINT信号产生过,但正在被阻塞,所以暂时不能递达。虽然它的处理动作是忽略,但在没有解除阻塞之前不能忽略这个信号,因为进程仍有机会改变处理动作之后再解除阻塞。
SIGQUIT信号未产生过,一旦产生SIGQUIT信号将被阻塞,它的处理动作是用户自定义函数sighandler。
如果在进程解除对某信号的阻塞之前这种信号产生过多次,将如何处理?POSIX.1允许系统递送该信号一次或多次。Linux是这样实现的:常规信号在递达之前产生多次只计一次,而实时信号在递达之前产生多次可以依次放在一个队列里。本章不讨论实时信号。
三、信号的捕获处理函数
(1)signal
信号的捕捉其实就是一个进程在收到信号的时候,把这个信号放到自己进程的pcb中的pending位图中。
可以看到在我们注册了2号信号的处理函数之后,该进程捕获到2号信号的时候,就会跳转到我们写的方法handler中,执行我们自己的代码。我们把这个称为信号的自定义处理!
(2)sigaction
对于struct sigaction结构体来说,他不仅仅只包含了信号处理函数和sa_mask,还有一些别的字段:换句话说,signal函数适合处理简单的应用场景,而sigaction不仅能够实现signal的功能,还能对实时信号的某些字段做出自定义行为。我们在这里只讨论sa_mask这个信号屏蔽字。
当某个信号的处理函数被调用时,内核自动将当前信号加入进程的信号屏蔽字,当信号处理函数返回时自动恢复原来的信号屏蔽字,这样就保证了在处理某个信号时,如果这种信号再次产生,那么 它会被阻塞到当前处理结束为止。 如果在调用信号处理函数时,除了当前信号被自动屏蔽之外,还希望自动屏蔽另外一些信号,则用sa_mask字段说明这些需要额外屏蔽的信号,当信号处理函数返回时自动恢复原来的信号屏蔽字。 sa_flags字段包含一些选项,本章的代码都把sa_flags设为0,sa_sigaction是实时信号的处理函数,不详细解释这两个字段,有兴趣的同学可以在了解一下。
四、信号集函数
(1)数据类型sigset_t及其位操作
从上图来看,每个信号只有一个bit的未决标志,非0即1,不记录该信号产生了多少次,阻塞标志也是这样表示的。因此,未决和阻塞标志可以用相同的数据类型sigset_t来存储,sigset_t称为信号集,这个类型可以表示每个信号的“有效”或“无效”状态,在阻塞信号集中“有效”和“无效”的含义是该信号是否被阻塞,而在未决信号集中“有效”和“无效”的含义是该信号是否处于未决状态。阻塞信号集也叫做当前进程的信号屏蔽字(Signal Mask),这里的“屏蔽”应该理解为阻塞而不是忽略。
sigset_t类型对于每种信号用一个bit表示“有效”或“无效”状态,至于这个类型内部如何存储这些bit则依赖于系统实现,从使用者的角度是不必关心的,使用者只能调用以下函数来操作sigset_ t变量,而不应该对它的内部数据做任何解释,比如用printf直接打印sigset_t变量是没有意义的
函数sigemptyset初始化set所指向的信号集,使其中所有信号的对应bit清零,表示该信号集不包含任何有效信号。
函数sigfillset初始化set所指向的信号集,使其中所有信号的对应bit置位,表示 该信号集的有效信号包括系统支持的所有信号。
注意,在使用sigset_ t类型的变量之前,一定要调 用sigemptyset或sigfillset做初始化,使信号集处于确定的状态。初始化sigset_t变量之后就可以在调用sigaddset和sigdelset在该信号集中添加或删除某种有效信号
这四个函数都是成功返回0,出错返回-1。sigismember是一个布尔函数,用于判断一个信号集的有效信号中是否包含某种 信号,若包含则返回1,不包含则返回0,出错返回-1。
(2) sigprocmask函数修改block位图
如果oset是非空指针,则读取进程的当前信号屏蔽字通过oset参数传出。如果set是非空指针,则 更改进程的信号屏蔽字,参数how指示如何更改。如果oset和set都是非空指针,则先将原来的信号 屏蔽字备份到oset里,然后根据set和how参数更改信号屏蔽字。假设当前的信号屏蔽字为mask,下表说明了how参数的可选值。
(3)sigpending函数读取pending位图
程序运行时,每秒钟把各信号的未决状态打印一遍,由于我们阻塞了SIGINT信号,按Ctrl-C将会 使SIGINT信号处于未决状态,按Ctrl-\仍然可以终止程序,因为SIGQUIT信号没有阻塞。
五、信号的捕获
如果信号的处理动作是用户自定义函数,在信号递达时就调用这个函数,这称为捕捉信号。由于信号处理函数的代码是在用户空间的,处理过程比较复杂,举例如下:
用户程序注册了SIGQUIT信号的处理函数sighandler。 当前正在执行main函数,这时发生中断或异常切换到内核态。 在中断处理完毕后要返回用户态的main函数之前检查到有信号SIGQUIT递达。 内核决定返回用户态后不是恢复main函数的上下文继续执行,而是执行sighandler函 数,sighandler和main函数使用不同的堆栈空间,它们之间不存在调用和被调用的关系,是 两个独立的控制流程。 sighandler函数返回后自动执行特殊的系统调用sigreturn再次进入内核态。 如果没有新的信号要递达,这次再返回用户态就是恢复main函数的上下文继续执行了。
所以我们从这里可以知道,信号处理的合适时机就是从内核态返回成用户态的时候,操作系统会对该进程的pending做检测,然后对信号进行递达。
六、SIGCHILD信号
进程一章讲过用wait和waitpid函数清理僵尸进程,父进程可以阻塞等待子进程结束,也可以非阻 塞地查询是否有子进程结束等待清理(也就是轮询的方式)。
采用第一种方式,父进程阻塞了就不 能处理自己的工作了;采用第二种方式,父进程在处理自己的工作的同时还要记得时不时地轮询一 下,程序实现复杂。
其实,子进程在终止时会给父进程发SIGCHLD信号,该信号的默认处理动作是忽略,父进程可以自 定义SIGCHLD信号的处理函数,这样父进程只需专心处理自己的工作,不必关心子进程了,子进程 终止时会通知父进程,父进程在信号处理函数中调用wait清理子进程即可。
事实上,由于UNIX 的历史原因,要想不产生僵尸进程还有另外一种办法:父进程调 用sigaction/signal手动将SIGCHLD的处理动作置为SIG_IGN,这样fork出来的子进程在终止时会自动清理掉,不 会产生僵尸进程,也不会通知父进程。系统默认的忽略动作和用户用sigaction函数自定义的忽略 通常是没有区别的,但这是一个特例。此方法对于Linux可用,但不保证在其它UNIX系统上都可用。