僵尸进程的原因以及预防方法和解决方法

时间:2023-01-09 19:46:04

今天偶尔看到多年前的一篇笔记。初看写得有点乱,整理了之后,看的似乎顺畅多了。全文如下。


现象及原因

僵尸进程的常见现象,就是某些进程即使以root帐号运行 kill -9 也杀不死。
之所以杀不死,是因为该进程虽然结束,但是它的内核栈(如进程描述符)依然驻留在内存中。
具体形成原因,就是没有做以下3个预防方法中的任何一个。


预防出现僵尸进程的方法:

预防办法一、
在fork()/execve()过程中,在父进程fork()之前安装SIGCHLD信号处理函数,并在此handler函数中调用waitpid()等待子进程结束,这样,内核才能获得子进程退出信息从而释放那个进程描述符。


预防方法二、
设置SIGCHLD信号为SIG_IGN(即,忽略SIGHLD信号),系统将不产生僵尸进程。
比如:对于服务器进程,如果父进程不等待子进程就结束,子进程将成为僵尸进程;若父进程等待子进程结束,就会影响服务器进程的并发性能。所以此时一般就将SIGCHLD信号设置为SIG_IGN.
    
预防方法三、
用两次fork(),然后使儿子进程直接退出,从而使孙子进程成为孤儿进程,进而由init进程负责清除这个孤儿进程。

出现僵尸进程后的补救方法:

杀死僵尸进程的父进程(僵尸进程的父进程必然存在),僵尸进程成为”孤儿进程”,过继给1号进程init,init始终会负责清理僵尸进程。


关于SIGHLD信号:

SIGCHLD属于UNIX以及类UNIX系统的一种信号,siginfo_t代码值如下:
1. 子进程已终止                         CLD_EXITED
2. 子进程异常终止(无core)   CLD_KILLED
3. 子进程异常终止(有core)   CLD_DUMPED
4. 被跟踪子进程以陷入              CLD_TRAPPED
5. 子进程已停止                         CLD_STOPED
6. 停止的子进程已经继续          CLD_CONTINUED

在一个进程终止或者停止时,将SIGCHLD信号发送给其父进程。按系统默认将忽略此信号。如果父进程希望被告知其子系统的这种状态,则应捕捉此信号。信号的捕捉函数中通常调用wait函数以取得进程ID和其终止状态。