Linux exec族函数解析

时间:2022-04-30 05:26:05

背景

在提到 vfork 函数时,我们提到了这个概念。为了更好地学习与运用,我们对exec族函数进行展开。

exec函数族 介绍

有时我们希望子进程去执行另外的程序,exec函数族就提供了一个在进程中启动另一个程序执行的方法。它可以根据指定的文件名或目录名找到可执行文件,并用它来取代原调用进程的数据段、代码段和堆栈段,在执行完之后,原调用进程的内容除了进程号外,其他全部被新程序的内容替换了。另外,这里的可执行文件既可以是二进制文件,也可以是Linux下任何可执行脚本文件。

在Linux中使用exec函数族主要有以下两种情况

  • 当进程认为自己不能再为系统和用户做出任何贡献时,就可以调用任何exec 函数族让自己重生。
  • 如果一个进程想执行另一个程序,那么它就可以调用fork函数新建一个进程,然后调用任何一个exec函数使子进程重生。

实际上,在Linux中并没有exec函数,而是有6个以exec开头的函数族:

#include <unistd.h>

int execl(const char *path, const char *arg, ...)
int execv(const char *path, char *const argv[])
int execle(const char *path, const char *arg, ..., char *const envp[])
int execve(const char *path, char *const argv[], char *const envp[])
int execlp(const char *file, const char *arg, ...)
int execvp(const char *file, char *const argv[])

参数介绍:

  • path:指定程序的具体路径及程序名字
  • arg :传入给程序的参数,最后参数必须为NULL;(NULL作为参数列表的结束标记)
  • file:命令名
  • envp:环境变量参数

函数返回值

函数返回值:

  • 成功 : 函数不会返回
  • 出错 : 返回-1,失败原因记录在error中。

在平时的编程中,如果用到了exec函数族,一定记得要加错误判断语句。因为与其他系统调用比起来,exec很容易受伤,被执行文件的位置,权限等很多因素都能导致该调用的失败。最常见的错误是:

  • 找不到文件或路径,此时errno被设置为ENOENT;
  • 数组argv和envp忘记用NULL结束,此时errno被设置为EFAULT;
  • 没有对要执行文件的运行权限,此时errno被设置为EACCES。

exec函数执行后, 把该进程所有信号设为默认动作

exec函数执行后, 把原先要捕捉的信号设为默认, 其他不变

exec 函数族各成员比较

这6 个函数在函数名和使用语法的规则上都有细微的区别,下面就可执行文件查找方式、参数表传递方式及环境变量这几个方面进行比较说明。

1)查找方式:上表其中前4个函数的查找方式都是完整的文件目录路径,而最后2个函数(也就是以p结尾的两个函数)可以只给出文件名,系统就会自动从环境变量$PATH所指出的路径中进行查找。

2)参数传递方式:exec函数族的参数传递有两种方式,一种是逐个列举的方式,而另一种则是将所有参数整体构造成指针数组进行传递。在这里参数传递方式是以函数名的第5位字母来区分的:

读者可以观察execl、execle、execlp的语法与execv、execve、execvp的区别。

  • 字母为“l”(list)的表示逐个列举的方式,
  • 字母为“v”(vertor)的表示将所有参数整体构造成指针数组传递,然后将该数组的首地址当做参数传给它,数组中的最后一个指针要求是NULL。

3)环境变量:exec函数族使用了系统默认的环境变量,也可以传入指定的环境变量。这里以“e”(environment)结尾的两个函数execle、execve就可以在envp[]中指定当前进程所使用的环境变量替换掉该进程继承的所以环境变量。

(4)PATH环境变量说明

PATH环境变量包含了一张目录表,系统通过PATH环境变量定义的路径搜索执行码,PATH环境变量定义时目录之间需用用“:”分隔,以“.”号表示结束。PATH环境变量定义在用户的.profile或.bash_profile中,下面是PATH环境变量定义的样例,此PATH变量指定在“/bin”、“/usr/bin”和当前目录三个目录进行搜索执行码。

PATH=/bin:/usr/bin:.
export $PATH

(5)进程中的环境变量说明

在Linux中,Shell进程是所有执行码的父进程。当一个执行码执行时,Shell进程会fork子进程然后调用exec函数去执行执行码。Shell进程堆栈中存放着该用户下的所有环境变量,使用execl、execv、execlp、execvp函数使执行码重生时,Shell进程会将所有环境变量复制给生成的新进程;而使用execle、execve时新进程不继承任何Shell进程的环境变量,而由envp[]数组自行设置环境变量。

(6)exec函数族关系

前4位统一为:exec

第5位:

  • l:参数传递为逐个列举方式,execl、execle、execlp
  • v:参数传递为构造指针数组方式,execv、execve、execvp

    第6位:
  • e:可传递新进程环境变量, execle、execve
  • p:可执行文件查找方式为文件名,execlp、execvp

事实上,这6个函数中真正的系统调用只有execve,其他5个都是库函数,它们最终都会调用execve这个系统调用,调用关系如下图12-11所示:

Linux exec族函数解析

(7)exec调用举例如下:

char *const ps_argv[] ={"ps", "-o", "pid,ppid,pgrp,session,tpgid,comm", NULL};
char *const ps_envp[] ={"PATH=/bin:/usr/bin", "TERM=console", NULL};
execl("/bin/ps", "ps", "-o", "pid,ppid,pgrp,session,tpgid,comm", NULL);
execv("/bin/ps", ps_argv);
execle("/bin/ps", "ps", "-o", "pid,ppid,pgrp,session,tpgid,comm", NULL, ps_envp);
execve("/bin/ps", ps_argv, ps_envp);
execlp("ps", "ps", "-o", "pid,ppid,pgrp,session,tpgid,comm", NULL);
execvp("ps", ps_argv);

请注意exec函数族形参展开时的前两个参数,第一个参数是带路径的执行码(execlp、execvp函数第一个参数是无路径的,系统会根据PATH自动查找然后合成带路径的执行码),第二个是不带路径的执行码,执行码可以是二进制执行码和Shell脚本。

(8)exec函数族使用注意点

在使用exec函数族时,一定要加上错误判断语句。因为exec很容易执行失败,其中最常见的原因有:

1)找不到文件或路径,此时errno被设置为ENOENT。

2)数组argv和envp忘记用NULL结束,此时errno被设置为EFAULT。

3)没有对应可执行文件的运行权限,此时errno被设置为EACCES。

(9)exec后新进程保持原进程以下特征

  • 环境变量(使用了execle、execve函数则不继承环境变量);
  • 进程ID和父进程ID;
  • 实际用户ID和实际组ID;
  • 附加组ID;
  • 进程组ID;
  • 会话ID;
  • 控制终端;
  • 当前工作目录;
  • 根目录;
  • 文件权限屏蔽字;
  • 文件锁;
  • 进程信号屏蔽;
  • 未决信号;
  • 资源限制;
  • tms_utime、tms_stime、tms_cutime以及tms_ustime值。

对打开文件的处理与每个描述符的exec关闭标志值有关,进程中每个文件描述符有一个exec关闭标志(FD_CLOEXEC),若此标志设置,则在执行exec时关闭该描述符,否则该描述符仍打开。除非特地用fcntl设置了该标志,否则系统的默认操作是在exec后仍保持这种描述符打开,利用这一点可以实现I/O重定向。

execlp函数举例

一、execlp.c源代码如下:

#include <stdio.h>
#include <unistd.h> int main()
{
if(fork()== 0){
if(execlp("/usr/bin/env","env",NULL)<0)
{
perror("execlp error!");
return -1 ;
}
}
return 0 ;
}

编译 gcc execlp.c –o execlp。

由执行结果看出,execlp函数使执行码重生时继承了Shell进程的所有环境变量,其他三个不以e结尾的函数同理。

二、execle函数举例 利用函数execle,将环境变量添加到新建的子进程中去。 execle.c源代码如下:

#include <unistd.h>
#include <stdio.h> int main()
{
/*命令参数列表,必须以 NULL 结尾*/
char *envp[]={"PATH=/tmp","USER=sun",NULL};
if(fork()==0){
/*调用 execle 函数,注意这里也要指出 env 的完整路径*/
if(execle("/usr/bin/env","env",NULL,envp)<0)
{
perror("execle error!");
return -1 ;
}
}
return 0 ;
}

编译:gcc execle.c –o execle。执行./execle,执行结果如下:

可见,使用execle和execve可以自己向执行进程传递环境变量,但不会继承Shell进程的环境变量,而其他四个exec函数则继承Shell进程的所有环境变量。

-- 摘录自《深入浅出Linux工具与编程》