1.2 Linux中的进程 --- fork、vfork、exec函数族、进程退出方式、守护进程等分析

时间:2022-03-27 04:02:38

fork和vfork分析:

  在fork还没有实现copy on write之前,Unix设计者很关心fork之后立即执行exec所造成的地址空间浪费,也就是拷贝进程地址空间时的效率问题,所以引入vfork系统调用。

  vfork有个限制,子进程必须立刻执行_exit或者exec函数。

  即使fork实现了copy on write,效率也没有vfork高,但是现在已经不推荐使用vfork了,因为几乎每一个vfork的实现,都或多或少存在一定的问题。

fork:子进程拷贝父进程的数据段;vfork:子进程与父进程共享数据段。

fork:父子进程的执行顺序不确定;vfork:子进程先运行,父进程后运行。

vfork函数的目的就是创建一个子进程,然后把一个应用给加载起来,相当于用一个应用去替换这个子进程(替换代码段、数据段、堆栈段,修改进程控制块),vfork之后,如果子进程不立即拉起一个应用,而是执行其他操作,则很可能修改了和父进程共享的数据,造成不稳定现象。

  下面看一个vfork的例子:

 #include <sys/types.h>
#include <unistd.h> #include <stdlib.h>
#include <stdio.h>
#include <string.h> #include <signal.h>
#include <errno.h> #include <sys/stat.h>
#include <fcntl.h> int main(void)
{
pid_t pid;
int fd = ;
int abc = ; printf("before fork pid : %d \n", getpid()); pid = vfork(); if(- == pid)
{
perror("pid < 0 ");
return -;
}
if(pid > )
{
printf("parent : pid : %d \n", getpid());
} if( == pid)
{
printf("child : %d, parent : %d\n", getpid(), getppid());
printf("abc : %d\n", abc);
} printf("after ...\n");
return ;
}

上面的程序中,vfork生成的子进程没有立即执行exit或者exec,而是做了两个打印操作,运行结果如下:

1.2   Linux中的进程 --- fork、vfork、exec函数族、进程退出方式、守护进程等分析

我们在第38行访问了数据段中的abc变量,程序进入了死循环,产生了不稳定现象。我们在第38行程序的下一行加上一句exit(0),运行结果如下:

1.2   Linux中的进程 --- fork、vfork、exec函数族、进程退出方式、守护进程等分析

这次运行就正常了。

  vfork主要用来拉起一个应用,我们创建一个文件hello.c,并写上如下程序:

 #include <stdio.h>

 int main()
{
printf("Hello World!\n");
return ;
}

  我们使用execve系统调用来拉起一个应用,修改vfork测试程序如下:

 #include <sys/types.h>
#include <unistd.h> #include <stdlib.h>
#include <stdio.h>
#include <string.h> #include <signal.h>
#include <errno.h> #include <sys/stat.h>
#include <fcntl.h> int main(void)
{
pid_t pid;
int fd = ;
int ret = ; printf("before fork pid : %d \n", getpid()); pid = vfork(); if(- == pid)
{
perror("pid < 0 ");
return -;
}
if(pid > )
{
printf("parent : pid : %d \n", getpid());
} if( == pid)
{
printf("child : %d, parent : %d\n", getpid(), getppid());
ret = execve("./hello", NULL, NULL); if(ret == -)
{
perror("execve");
exit(-);
} printf("execve execut failed\n"); exit();
} printf("after ...\n");
return ;
}

  执行结果如下:

1.2   Linux中的进程 --- fork、vfork、exec函数族、进程退出方式、守护进程等分析

由此可以看出,hello这个应用被成功拉起来了,子进程的整个进程空间被hello替换掉,因此后面的printf("execve execut failed\n")便不会再执行。

  修改程序,拉起一个ls应用,如下所示:

 #include <sys/types.h>
#include <unistd.h> #include <stdlib.h>
#include <stdio.h>
#include <string.h> #include <signal.h>
#include <errno.h> #include <sys/stat.h>
#include <fcntl.h> int main(void)
{
pid_t pid;
int fd = ;
int ret = ;
char * const argv[] = {"ls", "-l", NULL}; printf("before fork pid : %d \n", getpid()); pid = vfork(); if(- == pid)
{
perror("pid < 0 ");
return -;
}
if(pid > )
{
printf("parent : pid : %d \n", getpid());
} if( == pid)
{
printf("child : %d, parent : %d\n", getpid(), getppid());
ret = execve("/bin/ls", argv, NULL); if(ret == -)
{
perror("execve");
exit(-);
} printf("execve execut failed\n"); exit();
} return ;
}

执行结果如下:

1.2   Linux中的进程 --- fork、vfork、exec函数族、进程退出方式、守护进程等分析

  从结果看出execve成功拉起了ls应用。

进程终止的5种方式:

进程终止有5种方式,分别为:

正常退出:

  从main函数返回

  调用exit

  调用_exit

异常退出:

  调用abort, 产生SIGABOUT信号

  由信号终止,ctrl+c  SIGINT

其中exit和_exit的区别是:exit是c库函数,在退出之前会执行一些进程的清理工作,例如将用户空间缓冲区中的数据写到磁盘等,做完清理工作然后在调用_exit进入内核处理。_exit是系统调用,没有清理的过程,而是直接陷入内核去结束程序。二者的区别示意图如下:

1.2   Linux中的进程 --- fork、vfork、exec函数族、进程退出方式、守护进程等分析

下面演示这两个函数的区别,首先调用的是exit,程序如下:

 #include <stdio.h>
#include <unistd.h>
#include <stdlib.h> int main()
{
printf("hello ... ");
exit();
}

执行结果如下:

1.2   Linux中的进程 --- fork、vfork、exec函数族、进程退出方式、守护进程等分析

将exit(0)替换为_exit(0)却什么都没有打印出来,现象分析:

  printf输出语句向终端写数据时是行缓冲的,也即遇到‘\n’时就会将数据从应用空间缓冲区写入内核,如果没有遇到换行符,就先将数据存在应用空间的缓冲区中,exit在退出时会先将应用空间缓冲区中的数据写入到内核,然后再去内核执行真正的退出,而_exit直接进入内核,而应用空间缓冲区中的数据就相当于不要了,所以直接调用_exit时没有任何打印。

  exit执行时还可以调用终止处理程序,这个程序时我们自己注册的,这个注册的api函数就是atexit,下面我们直接给出实验程序:

 #include <stdio.h>
#include <unistd.h>
#include <stdlib.h> void bye1()
{
printf("bye1 ... \n");
} int main()
{
atexit(bye1);
printf("hello ... \n");
exit();
}

执行结果如下,终止处理程序被调用了:

1.2   Linux中的进程 --- fork、vfork、exec函数族、进程退出方式、守护进程等分析

我们可以注册多个终止处理程序,而且先注册的后执行。

  程序还可以调用abort异常退出,异常退出时,注册的终止处理程序不会被调用,演示程序如下:

 #include <stdio.h>
#include <unistd.h>
#include <stdlib.h> void bye1()
{
printf("bye1 ... \n");
} int main()
{
atexit(bye1);
printf("hello ... \n");
abort();
exit();
}

执行结果如下:

1.2   Linux中的进程 --- fork、vfork、exec函数族、进程退出方式、守护进程等分析

最后一种进程终止方式就是向进程发信号,如果是一个杀死进程的信号,那么进程就会消失,其他信号可以将睡眠(可中断睡眠)进程唤醒。

  测试小程序如下:

 #include <stdio.h>
#include <unistd.h>
#include <stdlib.h> void bye1()
{
printf("bye1 ... \n");
} int main()
{
atexit(bye1);
printf("hello ... \n");
sleep();
printf("after ... \n");
return ;;
}

  程序注册了终止处理程序,退出前睡眠100秒,在睡眠期间我们在键盘上按下crtl+c,执行结果如下:

1.2   Linux中的进程 --- fork、vfork、exec函数族、进程退出方式、守护进程等分析

进程被终止,而且终止处理程序没有被调用。我们在键盘上按下的ctrl+c发出的是SIGINT信号,这个信号用来终止进程运行。

SIGINT、SIGTERM、SIGKILL三者都是结束/终止进程运行,区别如下:

1.SIGINT SIGTERM区别

前者与字符ctrl+c关联,后者没有任何控制字符关联。

前者只能结束前台进程,后者则不是。

2.SIGTERM SIGKILL的区别

前者可以被阻塞、处理和忽略,但是后者不可以。KILL命令的默认不带参数发送的信号就是SIGTERM.让程序有好的退出。因为它可以被阻塞,所以有的进程不能被结束时,用kill发送后者信号,即可。即:kill -9 进程号。

exec函数族:

  在进程的创建上Unix采用了一种独特的方法,它将进程创建和加载一个新的进程映像相分离,这样做的好处是有更多的余地对两种操作进行管理。当我们创建了一个进程之后,通常将子进程替换成新的进程映像,这可以使用exec系列的函数来进行,当然exec系列的函数也可以将当前进程替换掉。

  exec函数族中的函数如下:

  int execl(const char *path, const char *arg, ...);
  int execlp(const char *file, const char *arg, ...);
  int execle(const char *path, const char *arg, ... , char * const envp[]);

  int execv(const char *path, char *const argv[]);
  int execvp(const char *file, char *const argv[]);

它们的关系如下:

1.2   Linux中的进程 --- fork、vfork、exec函数族、进程退出方式、守护进程等分析

只有execve是系统调用,其他几个只是库函数,是对execve的封装,前三个函数中的函数名字中 l 代表可变参数列表,p代表在PATH环境变量中搜索file文件,e代表环境变量。后面两个函数中v代表需要传入指针数组argv。 以上函数中,带p的函数只需要传入文件名,不带p的函数需要传入路径名。

下面演示execlp的使用,程序如下:

 #include <sys/types.h>
#include <unistd.h> #include <stdlib.h>
#include <stdio.h>
#include <string.h> #include <signal.h>
#include <errno.h> #include <sys/stat.h>
#include <fcntl.h> int main(void)
{
printf("before execlp \n");
execlp("ls", "ls", "-l", NULL); printf("after execlp \n");
return ;
}

执行结果如下:

1.2   Linux中的进程 --- fork、vfork、exec函数族、进程退出方式、守护进程等分析

execlp是对execve系统调用的封装,简化了函数的使用,l代表是可变参数,p代表PATH环境变量,我们只需要给这个函数传入可执行文件名,系统会自动根据PATH变量的值搜索这个文件。

  我们使用execlp拉起一个自己写的应用,如下:

 #include <stdio.h>

 int main()
{
printf("app getpid() : %d\n", getpid());
return ;
}

修改主控制函数:

 #include <sys/types.h>
#include <unistd.h> #include <stdlib.h>
#include <stdio.h>
#include <string.h> #include <signal.h>
#include <errno.h> #include <sys/stat.h>
#include <fcntl.h> int main(void)
{
printf("getpid() : %d \n", getpid());
execlp("./execlp-getpid", NULL, NULL); return ;
}

执行结果如下:

1.2   Linux中的进程 --- fork、vfork、exec函数族、进程退出方式、守护进程等分析

可见,原来的进程在拉起应用之后,进程pid是不变的。

  接着对execle进行实验分析,下面演示一个环境变量相关的小程序,这个小程序是被主控制程序拉起来的应用,程序如下所示:

 #include <sys/types.h>
#include <unistd.h>
#include <stdio.h>
#include <errno.h> extern char **environ; int main(void)
{
int i = ;
printf("before printf environ ... \n"); for(i = ; environ[i] != NULL; i++)
{
printf("%s\n", environ[i]);
} return ;
}

这个小程序如果单独执行的话,它会打印系统中所有的环境变量,如下所示:

1.2   Linux中的进程 --- fork、vfork、exec函数族、进程退出方式、守护进程等分析

下面我们给出主控制程序,这个程序将上面的打印环境变量的应用拉起来,最主要的函数是execle,具体如下:

 #include <sys/types.h>
#include <unistd.h>
#include <stdio.h> #include <errno.h> int main(void)
{
printf("getpid() : %d \n", getpid());
execle("./environ", NULL, NULL);
printf("after execle... \n");
return ;
}

execle中传入环境变量的部分我们给的是NULL指针,执行结果如下:

1.2   Linux中的进程 --- fork、vfork、exec函数族、进程退出方式、守护进程等分析

可见,被拉起来的应用中的for循环没有得到执行,这跟我们传入的NULL指针是有关系的。

  如果我们想在程序中定义自己的环境变量,并传给即将拉起来的应用程序,该怎么实现呢?修改主控制程序如下,打印环境变量的程序保持不变。

 #include <sys/types.h>
#include <unistd.h>
#include <stdio.h> #include <errno.h> int main(void)
{
char * const argv[] = {"aaa=111", "bbb=222", NULL};
printf("getpid() : %d \n", getpid()); execle("./environ", NULL, argv);
printf("after execle... \n");
return ;
}

执行结果如下,打印出了我们自己定义的环境变量:

1.2   Linux中的进程 --- fork、vfork、exec函数族、进程退出方式、守护进程等分析

守护进程:

  守护进程是在后台运行不受终端控制的进程,通常情况下守护进程在系统启动时自动运行。

  守护进程的名称通常以d结尾,比如sshd、xinetd、crond等。

创建守护进程的步骤如下:

1、调用fork创建新进程,它会是将来的守护进程

2、在父进程中调用exit,保证子进程不是进程组组长

3、调用setsid创建新的会话期

4、将当前目录改为根目录(如果把当前目录作为守护进程的目录,当前目录不能被卸载,它作为守护进程的工作目录了)

5、标准输入、标准输出、标准错误重定向到/dev/null

下面分析一个客户端登录框架,如下图:

1.2   Linux中的进程 --- fork、vfork、exec函数族、进程退出方式、守护进程等分析

telnet客户端登录到服务器上,会进行用户名和密码的校验,校验成功后,也就登录完成了,服务器会创建一个会话期,然后在这个会话期中默认执行一个shell。然后这个shell会去用户目录下执行$HOME/.bash_profile文件,这个shell是为这个用户服务的。

  这个登录相当于在客户端和服务器之间建立了一个会话期(session),在这个会话期里面可以有很多进程组,默认执行的shell就成为这个会话期中的一个进程组,当我们在这个shell上执行ps -ef | grep wbm01时,ps进程和grep进程成为一个进程组,它们和shell不属于一个进程组,但都在同一个会话期中。进程组组长的pid就是进程组的组号。现在执行的shell、ps、grep或者我们自己的hello程序都是和终端有关联的,所以它们都不是守护进程。

  如果我们想要做一个后台服务程序即守护进程,那么我们必须从这个会话期中跳出来,单独创建一个会话期,在新会话期中有我们自己fork出来的进程myforkproc,这个进程就可以脱离中断的控制了,这就是守护进程。创建守护进程的过程可以按以上我们给出的步骤来进行,也可以使用daemon一步完成。创建一个新会话的时候不能是进程组组长来调用setsid,所以应该先fork一个子进程,让子进程来调用setsid。调用setsid的进程将成为新会话期的leader进程,会话期id就是这个进程的pid,这个进程也会是新会话期中一个进程组的组长。

  跳出已有会话期,创建新会话期的框图如下:

1.2   Linux中的进程 --- fork、vfork、exec函数族、进程退出方式、守护进程等分析

演示程序如下:

 #include <sys/types.h>
#include <unistd.h> #include <stdlib.h>
#include <stdio.h>
#include <string.h> #include <signal.h>
#include <errno.h> int main()
{
pid_t pid; pid = fork(); if(- == pid)
{
perror("fork error");
exit(-);
} if(pid > )
{
exit();
} pid = setsid(); if(- == pid)
{
perror("setsid error");
exit();
} sleep(); printf("after deamon ...\n");
return ;
}

执行程序,结果如下:

1.2   Linux中的进程 --- fork、vfork、exec函数族、进程退出方式、守护进程等分析

可以看到a.out进程对应的终端那一列显示的是“?”,问号就代表这个进程没有终端,就是后台守护进程。

  根据创建守护进程的步骤,我们上面的程序还缺少两步,下面给出一个完整的程序:

 #include <sys/types.h>
#include <unistd.h> #include <stdlib.h>
#include <stdio.h>
#include <string.h> #include <signal.h>
#include <errno.h> #include <sys/stat.h>
#include <fcntl.h> int main()
{
pid_t pid; pid = fork(); if(- == pid)
{
perror("fork error");
exit(-);
} if(pid > )
{
exit();
} pid = setsid(); if(- == pid)
{
perror("setsid error");
exit();
} chdir("/");
int i = ;
for(i = ; i < ; i++)
{
close(i);
} open("/dev/null", O_RDWR);
dup();
dup(); sleep(); printf("after deamon ...\n");
return ;
}

  新添加的第40行将守护进程的工作目录设置为根目录,守护进程的工作目录默认为启动这个程序的目录,如果这个目录有被卸载的可能,则因为守护进程对这个目录的占用而不能卸载,所以要将工作目录设置为根目录。

  工作目录设置完成,然后关闭标准输入、标准输出、标准错误,这时候0,1,2三个文件描述符就空闲了,打开/dev/null,这个文件就占用了0描述符,dup函数负责将0号文件描述符复制到文件描述符表中的空闲项中,本例中也就是1和2。

  下面我们演示调用daemon来创建守护进程,程序如下:

 #include <sys/types.h>
#include <unistd.h>
#include <stdlib.h>
#include <stdio.h>
#include <errno.h> int main()
{
daemon(, ); printf("after ...\n");
return ;
}

  第一个参数0表示改变工作目录,第二个参数0表示关闭标准输入、标准输出、标准错误,第二个参数为0时,没有任何打印,因为标准输出关闭了,重定向到了/dev/null,如果第二个参数不为零,执行结果如下:

1.2   Linux中的进程 --- fork、vfork、exec函数族、进程退出方式、守护进程等分析

最后一句话打印出来了,说明守护进程没有关闭标准输出。