进程控制之解释器文件

时间:2022-11-05 17:10:35

所有现今的UNIX系统都支持解释器文件(interpreter file)(也可称为解释器脚本)。这种文件是文本文件其起始行格式是:

#! pathname [optional-argument]

感叹号和pathname之间的空格是可选的。最常见的解释器文件以下列行开始:

#!/bin/sh

pathname通常是绝对路径名,对它不进行什么特殊的处理(即不使用PATH进行路径搜索)。对这种文件的识别是由内核作为exec系统调用处理的一部分来完成的内核调用exec函数的进程实际执行的并不是该解释器文件,而是该解释器文件第一行中pathname所指定的文件。一定要将解释器文件(文本文件,它以#!开头)和解释器(由该解释器文件第一行中的pathname指定)区分开来。(我们可以认为:解释器文件就是在首行指定了其所使用的解释器的文本文件。)

要知道很多系统对解释器文件的第一行有长度限制。这些限制包括#!、pathname、可选参数、终止换行符以及空格数。在Linux中支持该限制为127字节。

实例

让我们观察一个实例,从中可了解当被执行的文件是解释器文件时,内核如何处理exec函数的参数及该解释器文件第一行的可选参数。程序清单8-10调用exec执行一个解释器文件。

程序清单8-10 执行一个解释器文件的程序

[root@localhost apue]# cat prog8-10.c
#include
"apue.h"
#include
<sys/wait.h>

int
main(
void)
{
pid_t pid;
if((pid = fork()) < 0)
{
err_sys(
"fork error");
}
else if(pid == 0) /* child */
{
if(execl("/home/zhu/apue/testinterp",
"testinterp", "myarg1", "MY ARG2", (char *)0) < 0)
err_sys(
"execl error");
}
if(waitpid(pid, NULL, 0) < 0) /* parent */
err_sys(
"waitpid error");
exit(
0);
}

程序清单8-10中被执行的解释器文件内容如下(只有一行):

[root@localhost apue]# cat testinterp
#
!/home/zhu/apue/echoarg foo

程序echoarg(解释器)回送每一个命令行参数(它就是程序清单7-3,参见:http://www.cnblogs.com/nufangrensheng/p/3507949.html)。

程序清单8-10运行结果:

[root@localhost apue]# ./prog8-10
argv[
0]: /home/zhu/apue/echoarg
argv[
1]: foo
argv[
2]: /home/zhu/apue/testinterp
argv[
3]: myarg1
argv[
4]: MY ARG2

注意,当内核exec该解释器(/home/zhu/apue/echoarg)时,argv[0]是该解释器的pathname,argv[1]是解释器文件中的可选参数,其余参数是pathname(/home/zhu/apue/testinterp),以及程序清单8-10中调用execl的第二个和第三个参数(myarg1和MY ARG2)。调用execl时的argv[1]和argv[2]已右移了两个位置(?)。注意,内核取execl调用中的pathname而非第一个参数(testinterp),因为一般而言,pathname包含了比第一个参数更多的信息(通常第一个参数只是pathname的一部分)。

总的来说,当内核exec解释器时,其命令行参数依次是该解释器的pathname、解释器的可选参数、解释器文件的pathname、exec函数调用参数列表中argv[0]以后的参数(不包括argv[0],通常argv[0]只是解释器文件pathname中的一部分)。(http://www.cnblogs.com/nufangrensheng/p/3510821.html中有提到我们可将argv[0]设置为任何字符串。

 

另外还有一篇关于解释器和解释器文件比较简明扼要的一篇文章,可参考:http://www.cnblogs.com/beacer/archive/2012/09/16/2687659.html

实例

在解释器pathname后可跟随可选参数。如果一个解释器程序支持-f选项,那么在pathname后经常使用的可选参数就是-f。

例如,可以以下列方式执行awk(1)程序:

awk -f myfile

它告诉awk从文件myfile中读取awk程序。

如果在解释器文件中使用-f选项,则可以写成:

#!/bin/awk -f
......

如果我们在myfile的第一行写:#!/bin/awk -f,那么我们想要执行awk程序myfile时,不必再输入命令awk –f myfile,而是直接输入命令myfile即可。

例如,程序清单8-11为/usr/local/bin/awkexample这样一个解释器文件。

程序清单8-11 作为解释器文件的awk程序

#!/bin/awk -f
BEGIN {
for(i=0; i<ARGC; i++)
printf
"ARGV[%d] = %s\n", i, ARGV[I]
exit

}

如果路径前缀之一是/usr/local/bin,则可以用下列方式执行程序清单8-11:

[root@localhost apue]# awkexample file1 FILENAME2 f3
ARGV[
0] = awk
ARGV[
1] = file1
ARGV[
2] = FILENAME2
ARGV[
3] = f3

其实,shell会这样调用exec:

exec("/usr/local/bin/awkexample",
"awkexample", "file1", "FILENAME2", "f3", NULL);

但是,实际上exec执行的是解释器/bin/awk而不是解释器文件awkexample,并且其命令行参数是:

/bin/awk -f /usr/local/bin/awkexample file1 FILENAME2 f3

 

是否一定需要解释器文件呢?那也不完全如此。但是它们确实使用户得到效率方面的好处,其代价是内核的额外开销(因为识别解释器文件的是内核)。

由于下述理由,解释器文件是有用的:

(1)有些程序是用某种语言编写的脚本,解释器文件可将这一事实隐藏起来。例如,为了执行程序8-11,只需使用下列命令行:

awkexample opitonal-arguments

而并不需要知道该程序实际上是一个awk脚本,否则就需要以下列方式执行该程序:

awk -f awkexample optional-arguments

(2)解释器脚本在效率方面也提供了好处。通常,用一个shell脚本代替解释器脚本需要更多的开销。

(3)解释器脚本使我们可以使用除/bin/sh以外的其他shell来编写shell脚本。(当execlp找到一个非机器可执行的可执行文件时(shell脚本是一个可执行文件,但却不是机器可执行的),它总是调用/bin/sh来解释执行该文件。)此时,我们只需要在解释器脚本首行指明所用的shell即可。

本篇博文内容摘自《UNIX环境高级编程》(第二版),仅作个人学习记录所用。关于本书可参考:http://www.apuebook.com/