Linux学习之"fork函数"

时间:2022-03-14 00:02:33

n fork函数创建一个新进程,新进程被称为子进程
n 函数原型:pid_t fork(void)
n 返回值:
fork函数调用一次,但是返回两次:在子进程中返回0,在父进程中返回子进程ID,出 错返回-1。通过返回值,可以确定是在父进程还是子进程中。
n 子进程和父进程继续执行fork调用之后的指令。
子进程是父进程的副本
1.子进程获得父进程数据空间、堆和栈的副本;父子进程并 不共享这些存储空间
2.父子进程 共享正文段(只读的)
3.为了提高效率,fork后并不立即复制父进程空间,采用了 COW(Copy-On-Write) ;当父子进程任意之一,要修改数据段、堆、栈时, 进行复制操作,但仅复制修改区域
看一个程序:
#include<iostream>
#include<unistd.h>
#include<stdio.h>

using namespace std;

int glob = 6;
char buf[] = "a write to stdout\n";

int main(void)
{
int var;
pid_t pid;

var = 88;

if (write(STDOUT_FILENO, buf, sizeof(buf)-1) != sizeof(buf)-1)
{
cout << "write error" << endl;
return 0;
}

printf("before fork\n");

if ( (pid = fork()) < 0)
{
cout << "fork error" << endl;
return 0;
}
else if (pid == 0)
{
glob++;
var++;
}
else
{
sleep(2);
}

printf("pid = %d, glob = %d, var = %d\n", getpid(), glob, var);

return 0;
}
直接输出到控制台:
a write to stdout
before fork
pid = 1867, glob = 7, var = 89
pid = 1866, glob = 6, var = 88
使用重定向“./a.out>a.txt”,a.txt内容如下:
a write to stdout
before fork
pid = 1939, glob = 7, var = 89
before fork
pid = 1938, glob = 6, var = 88
为什会有这个差别?
先来看下“STDOUT_FILENO ”和“FILE *stdout ”的区别:
stdin / stdout / stderr是FILE*类型,供标准C++一级提供的文件操作函数库使用,定义在头文件<stdio.h>中。
STDIN_FILENO / STDOUT_FILENO / STDERR_FILENO 是int类型, 其实质是文件描述符(值分别为0,1,2),定义在头文件<unistd.h>中。
FILE * stdin / stdout / stderr 对应的文件描述符(fd)分别是 STDIN_FILENO(0) / STDOUT_FILENO(1) / STDERR_FILENO(2) 。
两者的差别主要是 标准I/O是带缓冲(具体见下面说明)的,而STDIN_FILENO / STDOUT_FILENO / STDERR_FILENO是不带缓冲的
我们只需记住:
使用stdin / stdout / stderr的函数主要有:fread、fwrite、fclose等,基本上都以f开头。
使用STDIN_FILENO / STDOUT_FILENO / STDERR_FILENO的函数有:read、write、close等。
关于两者更详细的说明:
1.“FILE *stdout 和 STDOUT_FILENO 的区别”(http://hi.baidu.com/_%C2%B7_%C8%CB_%BC%D7_/blog/item/2d84a816882fdbd4c2fd78e1.html)
2." 对stdin,stdout 和STDOUT_FILENO,STDIN_FILENO的学习"(http://www.cnblogs.com/hoys/archive/2011/05/11/2043044.html)
下面看下关于"printf"/"write"和缓冲的说明:
printf是在stdio.h中声明的函数,而标准IO都是带缓冲的,所以printf是带缓冲的。而write则是不带缓冲的。
标准IO在输入或输出到终端设备时,它们是行缓冲的,否则(文件)它们是全缓冲的。而标准错误流stderr是不使用缓冲的。更为准确的描述是: 当且仅当标准输入和标准输出并不涉及交互式设备使,他们才是全缓冲的。标准出错流不使用缓冲。
下列情况会引发缓冲区的刷新(清空缓冲区):
1、缓冲区满时;
2、执行flush语句;
3、执行endl语句(printf是"\n");
4、关闭文件
综上所述,write的内容在父进程直接输出到了设备,“ before fork”在主线程输出到终端后因为换行符而清空了缓冲区,所以也只输出了一次。
而重定向到"a.txt"时,printf使用的是全缓冲,所以“ before fork”并未输出到设备,而是随着fork()而被复制了一份到子进程的空间中,所以输出了两次。
注意:在重定向父进程输出时,子进程也被重定向了。

为什么父进程要等待2秒?

在fork时,父进程所有打开的文件描述符都被复制一份到子进程中,然而他们共享文件描述符所指向的文件对象(FILE结构:描述文件读写指针,偏移量,标志等)。如果不等待,文件偏移量被交替修改,很可能产生混乱的输出。