进程创建——父子进程

时间:2021-08-02 17:34:15

fork()

用来创建进程fork(void)

在linux中所有进程都是由init进程直接或间接创建

成功:在父进程中将返回子进程的PID;子进程返回0,以区别父进程

失败:父进程中返回-1

 1 #include <stdio.h>
2 #include <unistd.h>
3 #include <sys/types.h>
4
5 int main(int argc,char *argv[])
6 {
7 pid_t pid;
8 if((pid=fork())==-1)
9 printf("fork error");
10 printf("bye\n");
11 printf("当前进程的进程号pid:%d\n当前进程的父进程号ppid:%d\n",getpid(),getppid());
12 return 0;
13 }

结果:

[root@sun PCB]# ps aux

root      3905  0.0  0.1 108468  1904 pts/0    S    Dec17   0:00 bash
[root@sun PCB]# ./fork
bye
bye
当前进程的进程号pid:4570
当前进程的父进程号ppid:3905
pid=fork()中pid的值:4571  //在父进程中将返回子进程的PID
当前进程的进程号pid:4571
当前进程的父进程号ppid:4570
pid=fork()中pid的值:0  //子进程返回0,以区别父进程

子进程中的代码在fork返回位置执行;子进程创建成功之后,和父进程同时执行,竞争系统资源,谁先执行由调度算法决定。

父子进程

子进程会复制父进程的几乎所有信息:子进程复制父进程用户空间所有数据;

                 子进程复制父进程内核空间PCB中绝大多数数据;

一、文件流缓冲区的资源位于用户空间,所以全部复制。即如果流缓冲区中有临时信息,都会复制到子进程的用户空间流缓冲区中。

 1 #include <stdio.h>
2 #include <unistd.h>
3 #include <stdlib.h>
4
5 int main(int argc,char *argv[])
6 {
7 pid_t pid;
8 printf("在fork之前,有回车\n");
9 printf("在fork之前,没有回车,getpid()——pid=%d\t",getpid());
10 pid=fork();
11 if(pid==0)
12 printf("\nfork后创建的子进程getpid()——pid=%d\n",getpid());
13 else
14 printf("\nfork后创建的父进程getpid()——pid=%d\n",getpid());
15 }

 

[root@sun PCB]# ./streamfork
在fork之前,有回车
在fork之前,没有回车,getpid()——pid=5536    
fork后创建的父进程getpid()——pid=5536
在fork之前,没有回车,getpid()——pid=5536    
fork后创建的子进程getpid()——pid=5537

按照上面所说,子进程要在fork方法执行并返回某值后才会复制代码到子进程,子进程从返回值位置向后执行,不会执行之前的代码,但这段代码却输出了之前的代码,这就是复制了缓冲区的缘故。

之所以出现两次输出,有两方面原因,首先是跟printf的缓冲机制有关,我们在前面说过printf("%d",i)=fprintf(stdout,"%d",i),就是说printf函数输出某些内容时,操作系统仅仅是把该内容放到了stdout的缓冲队列里了,并没有立刻写到屏幕上。但是,只要看到有/n 则会立即刷新stdout,才能够马上打印了。

其次就是因为复制了缓冲区。由于父进程在fork前输出的第二个printf函数时没有回车,而输出流是带缓冲的,从而该信息缓存到用户空间fork创建子进程后,系统为子进程复制父进程数据空间以及标准输出缓冲区,子进程刷新了输出缓冲区,将数据输出。

 二、子进程复制父进程的数据段,BSS段,代码段,堆空间,栈空间,文件描述符,但是对于文件描述符关联的内核文件表项(即struct file结构体)则是采用共享的方式

 

 1 #include <stdio.h>
2 #include <stdlib.h>
3 #include <string.h>
4 #include <unistd.h>
5 #include <fcntl.h>
6 #include <sys/types.h>
7
8 int main(int argc,char *argv[])
9 {
10 pid_t pid;
11 int fd;
12 int i=1;
13 int status;
14 char *ch1="hello";
15 char *ch2="world";
16 char *ch3="IN";
17 if((fd=open("test.txt",O_RDWR|O_CREAT,0644))==-1)
18 {
19 perror("parent open");
20 exit(EXIT_FAILURE);
21 }
22 if(write(fd,ch1,strlen(ch1))==-1)
23 {
24 perror("parent write");
25 exit(EXIT_FAILURE);
26 }
27 if((pid=fork())==-1)
28 {
29 perror("fork");
30 exit(EXIT_FAILURE);
31 }
32 else if(pid==0)
33 {
34 i=2;
35 printf("in chile\n");
36 printf("i=%d\n",i);
37 if(write(fd,ch2,strlen(ch2)));
38 perror("chile write");
39 return 0;
40 }
41 else
42 {
43 sleep(1);//等待子进程先执行
44 printf("in parent\n");
45 printf("i=%d\n",i);
46 if(write(fd,ch3,strlen(ch3)));
47 perror("parent write");
48 wait(&status);//等待子进程结束
49 return 0;
50 }
51 }

 

[root@sun PCB]# ./forkfilrstruct
in chile
i=2
chile write: Success  

//在这里明显等待1s才出现in parent,即sleep()让父进程等待1s好让子进程完成写ch2的操作,1s后再写ch3
in parent
i=1
parent write: Success


[root@sun PCB]# cat test.txt
helloworldIN

从test.txt的内容可以看出,父子进程对同一个文件操作,写入数据也不覆盖,即说明父子进程共享文件偏移,因此共享文件表项

而从变量i可以看出子进程赋值后父进程的i值不变,说明父子进程各自拥有这一变量的副本,互相不影响。

这里对wait函数稍加介绍:

wait(等待子进程中断或结束)

wait()会暂时停止进程的执行,直到有信号来到或子进程结束。如果在调用wait()时子进程已经结束,则wait()会立即返回子进程结束状态值,由参数status 返回,而子进程的进程识别码也会一起返回。如果不在意结束状态值,则参数status 可以设成NULL。

 vfork()

vfolk()创建新进程时不复制父进程的地址空间,而是在必要的时候才申请新的存储空间,共享父进程的代码以及数据段等

 1 #include<unistd.h>
2 #include<error.h>
3 #include<sys/types.h>
4 #include<stdio.h>
5 #include<stdlib.h>
6 int glob=6;    //已初始化全局变量,存放在数据段
7 int main()
8 {
9 int var;
10 pid_t pid;
11 var=88;    //局部变量,存放在栈
12 printf("in beginning:\tglob=%d\tvar=%d\n",glob,var);
13 if((pid=vfork())<0)
14 {
15 perror("vfork");
16 exit(EXIT_FAILURE);
17 }
18 else if(pid==0)
19 {
20 printf("in child,modify the var:glob++,var++\n");
21 glob++;
22 var++;
23 printf("in child:\tglob=%d\tvar=%d\n",glob,var);
24 _exit(0);
25 }
26 else
27 {
28 printf("in parent:\tglob=%d\tvar=%d\n",glob,var);
29 return 0;
30 }
31 }

输出的glob,var的值相同,均是自加之后的结果,说明子进程修改后父进程跟着改变,即两者共享。

若vfork改成fork,则子进程是自加后的结果,父进程不变,说明子进程是父进程的一份复制。

但是由于父子空间共享内存空间,使得由子函数调用vfork创建的子进程(架设子进程为先执行函数的进程)调用其它函数或运行其他程序后会,父进程会出现段错误,如下:

 1 #include<stdio.h>
2 #include<unistd.h>
3 #include<stdlib.h>
4 void test()
5 {
6 pid_t pid;
7 pid=vfork();//创建子进程
8 if(pid==-1)
9 {
10 perror("vfork");
11 exit(EXIT_FAILURE);
12 }
13 else if(pid==0)  //子进程先运行
14 {
15 printf("1:child pid=%d,ppid=%d\n",getpid(),getppid());
16 return;
17 }
18 else
19 printf("2:parent pid=%d,ppid=%d\n",getpid(),getppid());
20 }
21 void fun()
22 {
23 int i;
24 int buf[100];
25 for(i=0;i<100;i++)
26 buf[i]=0;
27 printf("3:child pid=%d,ppid=%d\n",getpid(),getppid());
28 }
29 int main()
30 {
31 pid_t pid;
32 test();
33 fun();
34 }

1.创建主函数,申请栈空间(局部变量、返回值、参数等)

2.调用test函数,申请test函数的栈空间

3.test函数创建子进程,子进程先运行,在test中输出pid和ppid,清理栈空间

4.子进程调用fun函数,覆盖原来test函数的栈空间,执行完毕后退出

5.父进程从返回处开始执行,可是栈已经不存在了

 

所以如果希望在创建的子进程中运行新的程序,则用fork()函数创建子进程,再用exec系列函数替代子进程用户空间的资源(代码、堆、栈等),内核信息基本不修改。

execl系列

 1 #include <stdio.h>
2 #include <unistd.h>
3 #include <sys/types.h>
4
5 int main(int argc,char* argv[])
6 {
7 pid_t pid;
8 if((pid=fork())<0)
9 {
10 printf("error");
11 }
12 else if(pid==0)
13 {
14 execl("/bin/ls","ls","-l","/home",(char *)0);
15 }
16 else
17 printf("father ok!\n");
18
19 }

[root@sun task]# ./execl
father ok!
[root@sun task]# 总用量 16
drwxr-xr-x.  4 root   root   4096 11月 14 23:10 df
drwx------. 29 hadoop hadoop 4096 9月   4 23:15 hadoop
drwx------. 44 sun    sun    4096 12月 30 04:45 sun
drwxr-xr-x. 12 root   root   4096 12月 30 05:01 test
在执行execl系列函数时,默认情况下,新代码可以使用原来代码中打开的文件描述符,即执行execl时,并不关闭进程原来打开的文件

 1 #include <stdio.h>
2 #include <unistd.h>
3 #include <sys/types.h>
4 #include <fcntl.h>
5 #include <string.h>
6 #include <stdlib.h>
7
8 int main(int argc,char* argv[])
9 {
10 int fd,status;
11 pid_t pid;
12 fd=open("test.txt",O_RDWR|O_APPEND|O_CREAT,0644);//打开文件,产生一个文件描述符fd,从文件尾开始追加
13 if(fd==-1)
14 {
15 perror("open");
16 exit(EXIT_FAILURE);
17 }
18 printf("before child process write\n");
19 system("cat test.txt");//创建新进程,在新进程中运行命令,直到新进程运行结束在运行父进程
20 if((pid=fork())==-1)
21 {
22 perror("fork");
23 exit(EXIT_FAILURE);
24 }
25 if(pid==0)
26 {
27 char buf[128];
28 sprintf(buf,"%d",fd);//将文件描述符写入缓冲区
29 execl("./newcode","newcode",buf,(char *)0);//执行newcode,把文件描述符以参数的形式传递给代码newcode,在newcode中执行对文件的追加写入工作
30 }
31 else
32 {
33 wait(&status);
34 printf("after child_process write\n");
35 system("cat test.txt");
36 }
37 }
 1 #include <stdio.h>
2 #include <string.h>
3 #include <unistd.h>
4
5 int main(int argc,char* argv[])
6 {
7 int i;
8 int fd;
9 char *ptr="helloworld\n";
10 fd=atoi(argv[1]);//argv[1]中的值是写入buf的fd=open("test.txt",O_RDWR|O_APPEND|O_CREAT,0644)
11 i=write(fd,ptr,strlen(ptr));//写入fd关联的test.txt中,执行成功,说明原来的文件描述符可以使用
12 if(i<=0)
13 perror("write");
14 close(fd);
15 }

[root@sun task]# ./system_execl
before child process write
我是测试文件
after child_process write
我是测试文件
helloworld