Linux进程与子进程

Linux进程

进程是Linux中事务管理的基本单元，所有的进程都拥有自己的独立处理环境和系统资源，并且各进程之间不可以直接访问对方的资源，进程之间的交流需要通过特定的机制（IPC）。

在Linux系统的内核头文件中（/usr/src/kernels/内核版本/include/linux/sched.h）定义了进程控制块（PCB）结构体struct task_struct来管理每个进程的资源。

进程资源分为两个部分：内核空间进程资源、用户空间进程资源

内核空间进程资源：PCB的相关信息，控制块本身、打开的文件表项、当前目录、当前终端信息、线程基本信息、可访问的内存空间、PID、PPID、UID、EID等。

用户进程空间资源：通过成员mm_struct映射的内存空间，实际上就是进程的代码段、数据段、堆、栈、可访问的共享库内存空间。这些资源在进程退出的时候主动释放。在进程运行时，可以通过查

看/proc/{pid}/maps文件查看可以访问的地址空间。

进程的状态：就绪、运行、等待（可中断、不可中断）、停止、僵死

在/usr/src/kernels/内核版本/include/linux/sched.h头文件中定义了进程的状态

/*
 * Task state bitmask. NOTE! These bits are also
 * encoded in fs/proc/array.c: get_task_state().
 *
 * We have two separate sets of flags: task->state
 * is about runnability, while task->exit_state are
 * about the task exiting. Confusing, but this way
 * modifying one set can't modify the other one by
 * mistake.
 */
#define TASK_RUNNING		0
#define TASK_INTERRUPTIBLE	1
#define TASK_UNINTERRUPTIBLE	2
#define __TASK_STOPPED		4
#define __TASK_TRACED		8
/* in tsk->exit_state */
#define EXIT_ZOMBIE		16
#define EXIT_DEAD		32
/* in tsk->state again */
#define TASK_DEAD		64
#define TASK_WAKEKILL		128
#define TASK_WAKING		256
#define TASK_PARKED		512
#define TASK_STATE_MAX		1024

进程之间状态的转换图如下：

Linux进程与子进程

进程的属性

进程本身的属性：PID（进程号）、PPID（父进程号）、PGID（进程组号）、SID（会话session ID）

调用getpid()函数可以获取当前进程的PID，该函数在/usr/include/unistd.h头文件中声明；

调用getppid()函数可以获取当前进程父进程的PID，该函数在/usr/include/unistd.h头文件中声明；

调用getpgid(_pid_t _pid)函数可以获取指定进程_Pid的进程组号，该函数在/usr/include/unistd.h头文件中声明；

调用getsid(_pid_t _pid)函数可以获取指定进程_Pid的会话号SID（会话是一个或者多个进程的集合），该函数在/usr/include/unistd.h头文件中声明；

进程的用户属性：RUID（真实用户ID）、RGID（真是用户组ID）、EUID（有效用户ID）、EGID（有效用户组ID）

调用getuid()函数可以获取该进程的真实用户RUID（执行此程序的用户，创建该进程用户的UID为此进程的RUID），该函数在/usr/include/unistd.h头文件中声明；

调用geteuid()函数可以获取有效用户ID，该函数在/usr/include/unistd.h头文件中声明；

调用getgid()获取进程的用户组ID（创建进程的用户所在的组号），该函数在/usr/include/unistd.h头文件中声明；

调用getegid()获取有效进程用户组ID，该函数在/usr/include/unistd.h头文件中声明；

进程的管理

创建进程fork 和 vfork

在Linux环境下，创建进程的主要方法是调用fork函数。Linux下的所有进程都是由init进程（第一个进程PID=1）直接或者间接的创建，fork函数在/usr/include/unistd.h头文件中声明；

若fork函数调用，那么将产生两个进程分支（父进程和子进程），在父进程中返回子进程的ID（大于0），在子进程中返回0；若调用失败，在父进程中返回0；

下面是创建调用fork函数的程序

#include<stdio.h>
#include<unistd.h>

int main()
{
        pid_t pid;

        if( (pid=fork()) == -1 ) //call fork() and test if succeed
        {
                printf("fork error!");
                return -1;
        }
        else if(pid == 0)  //in sub thread
        {
                printf("This is sub thread.\n");
                printf("in sub : My PID = %d\n",getpid());
                printf("in sub : My PPID = %d\n",getppid());
        }
        else   //in father thread
        {
                printf("This is father thread.\n");
                printf("in father : My PID = %d\n",getpid());
        }

        return 0;
}

子进程与父进程

子进程将复制父进程用户空间的所有信息（文件缓冲区、代码段、数据段、BSS段、堆、栈、文件描述符），其中复制的仅仅是文件描述符，但是对于与文件描述符关联的内核文件表项（struct file结构体）则是采用的是共享的方式。

下面的程序中，虽然子进程复制了父进程的文件描述符fd，但是和父进程操作的是同一个文件

#include <sys/types.h>
#include <stdio.h>
#include <unistd.h>
#include <fcntl.h>
#include <string.h>
#include <stdlib.h>
int main(int argc,char *argv[])
{
    pid_t pid;
    int fd;
    int i=1;
    int status;
    char *ch1="hello";
    char *ch2="world";
    char *ch3="IN";
    if((fd=open("test.txt",O_RDWR|O_CREAT,0644))==-1)//打开一个文件
    {
        perror("parent open");
        exit(EXIT_FAILURE);
    }
    if(write(fd,ch1,strlen(ch1))==-1)//父进程向文件中写入字符串1
    {
        perror("parent write");
        exit(EXIT_FAILURE);
    }

    if((pid=fork())==-1)//创建一个子进程
    {
        perror("fork");
        exit(EXIT_FAILURE);
    }
    else if(pid==0)  //在子进程中
    {
        i=2;
        printf("in child\n");
        printf("i=%d\n",i);
        if(write(fd,ch2,strlen(ch2))==-1)//子进程复制了父进程的fd，然后向文件中写入字符串2
            perror("child write");
        return 0;
    }
    else
    {
        sleep(1);//休眠1秒钟，等待子进程执行完毕
        printf("in parent\n");
        printf("i=%d\n",i);
        if(write(fd,ch3,strlen(ch3))==-1)//父进程写入字符串3
            perror("parent,write");
        wait(&status);//等待子进程结束
        return 0;
    }
}

使用vfork创建进程

使用fork创建进程会复制父进程用户空间的大量数据，有些场景这样做是极大的浪费，所以使用vfork创建新进程时并不复制父进程的地址空间，而是在必要的时候才申请新的存储空间，vfork比fork可以极大程度的提高性能。vfork只在需要的时候复制，一般采用和父进程共享所有资源的方式处理。

下面的程序说明了vfork创建的子进程和父进程共享数据段和代码段。

#include<unistd.h>
#include<error.h>
#include<sys/types.h>
#include<stdio.h>
#include<stdlib.h>
int glob=6;
int main()
{
        int var;
        pid_t pid;
        var=88;
        printf("in beginning:\tglob=%d\tvar=%d\n",glob,var);
        if((pid=vfork())<0)
        {
                perror("vfork");
                exit(EXIT_FAILURE);
        }
        else if(pid==0)
        {
                printf("in child,modify the var:glob++,var++\n");
                glob++;
                var++;
                printf("in child:\tglob=%d\tvar=%d\n",glob,var);
                _exit(0);
        }
        else
        {
                printf("in parent:\tglob=%d\tvar=%d\n",glob,var);
                return 0;
        }
}

上述程序共享glob和var变量，如果把上述中的vfork改为fork结果将会不一样。

结束进程

结束进程意味着要回收进程的资源，又可以分为回收进程用户空间的资源和回收进程内核空间的资源

回收用户进程空间的资源

进程在正常退出前都需要执行退出处理函数，刷新流缓冲区等操作，然后释放用户进程空间的所有资源，而进程在内核中的资源PCB并不会立即释放，仅仅调用退出函数而没有回收内核资源PCB的进程是一个僵死进程。

显示的调用exit或者_exit系统调用可以结束进程。调用exit将以反序的方式执行由on_exit函数和atexit函数注册的清理函数，同时刷新缓冲区，并把退出状态status返回给父进程。_exti是直接退出，仅仅把退出状态交给父进程，不会进行清理工作和刷新缓冲区。

注意：exit和return的区别，exit退出当前进程，而return仅仅退出当前函数。

回收内核空间的资源

回收内核空间的资源不是由退出进程本身完成的，而是由该进程的父亲进程完成的。调用wait函数的父进程将阻塞式的等待该进程的任意一个子进程结束后，回收该子进程的内核空间的资源，wait函数定义在/usr/include/sys/wait.h头文件中。还可以使用waitpid函数等待指定子进程结束，其定义在/usr/include/sys/Wait.h中

孤儿进程和僵死进程

孤儿进程：因为父进程退出而导致一个子进程被init进程收养的进程称为孤儿进程，即孤儿进程的父进程改为init进程。

僵死进程：进程已经退出（用户空间的资源已经被回收），但是其父亲进程还没有回收内核资源的进程称为僵死进程，即该进程在内核空间的PCB没有被释放。

下面的程序演示了一个孤儿进程

#include<stdio.h>
#include<stdlib.h>
#include<unistd.h>

int main()
{
        pid_t pid;
        if((pid=fork())==-1)
                perror("fork");
        else if(pid==0)
        {
                printf("sub : pid=%d,ppid=%d\n",getpid(),getppid());
                sleep(2);
                printf("sub : pid=%d,ppid=%d\n",getpid(),getppid());
        }
        else
        {
                printf("father : pid=%d,ppid=%d\n",getpid(),getppid());
                sleep(1);
                exit(0);
        }
}

下面的程序演示了一个僵死进程

#include<stdio.h>
#include<unistd.h>
#include<stdlib.h>

int main()
{
        pid_t pid;
        if((pid=fork())==-1)
                perror("fork");
        else if(pid==0)
        {
                printf("child_pid pid=%d\n",getpid());
                exit(0);
        }
        sleep(3);
        system("ps");
        exit(0);
}

程序的运行结果：

运行结果中的PID=10375的进程僵死，如果此时打开/proc/10375/maps（该进程的用户进程空间信息），可以发现为空，也就是用户进程空间资源已经被回收。

守护进程

守护进程是一种在后台运行的特殊进程，它脱离终端，从而可以避免守护进程被任何终端信号打断，它执行产生的信息也不在任何终端显示。守护进程周期性的执行某种任务或等待处理某些发生的事件，Linux的大多数服务器就是使用守护进程实现的，比如web服务器httpd等。

一般情况下，守护进程可以通过以下方式启动：

（1）在系统启动时启动脚本，通常放在/etc/rc.d目录中；

（2）利用inet超级服务器启动，如telnet等；

（3）由cron命令定时启动以及在终端用nohup命令启动的进程也是守护进程。

创建一个守护进程需要遵循以下要点：

（1）屏蔽一个有关控制终端操作的信号

（2）在后台运行。方法是在进程中创建子进程，并使父进程终止，使其在子进程中后台运行。

（3）脱离终端控制和进程组，这是因为一个进程属于一个进程组，同进程组的进程共享一个控制终端，而一个进程关联的控制终端和进程组通常是从父进程继承下来的，因此子进程仍然受到父进程终端的影响。可以使用setsid()使子进程成为一个新的会话组长和进程组长，与原来的进程组脱离关系。

（4）禁止进程重新打开控制终端。进程已经成为一个无终端的会话组长，但是仍然有权限申请一个终端，只有会话组长才能打开终端。采用的办法是再创建一个子进程，并让父进程退出，该子进程就不再是会话组长了，而且父进程也没有终端控制。

（5）关闭打开的文件描述符。子进程会从父进程复制文件描述符，这对守护进程没有意义，反而会浪费系统资源，造成进程所占的文件系统无法卸载。

（6）改变当前工作目录。进程活动的时候，进程工作目录所在的文件系统不能卸载，因此一般将守护进程的工作目录设置为合适的目录。

（7）重设文件创建的掩码。进程从父进程那里继承文件创建掩码umask，它可能修改守护进程所创建的文件的存储权限，一般将文件创建掩码清除。

（8）处理SIGCHLD信号（子进程退出信号）

秒客网

Linux进程与子进程

相关文章