Unix系统编程()文件描述符和打开文件之间的关系

时间:2022-06-16 21:57:59

目前学习到的是一个文件描述符对应着一个打开的文件,似乎是一一对应的关系。但是实际上并不是这样的。多个文件描述符指向同一个打开的文件,是可能的也是必要的。这些文件描述符可以在相同或者不同的进程中打开。

 

要理解具体情况,需要查看内核维护的3个数据结构。

进程级的文件描述符表

系统级的打开文件表

文件系统的i-node表

 

针对每个进程,内核为其维护打开文件的描述符(open file descriptor)表。该表的每一条目都记录了单个文件描述符的相关信息。包括有一下信息:

 

控制文件描述符操作的一组标志。(目前,此类标志仅定义了一个,即close-on-exec标志)

打开文件句柄的引用

 

内核对所有打开的文件维护有一个系统级的描述符表格(open file description table)。有时也称之为打开文件表(open file table),并将表中各条目称之为打开文件句柄(open file handle)。一个打开文件句柄存储了一个与打开文件相关的全部信息,如下所示。

 

当前文件偏移量(调用read和write时更新,或者使用lseek直接修改)。

打开文件时所使用的的状态标志(即open的flags参数)

文件的访问模式(如调用open时所设置的只读模式,只写模式或读写模式)

与信息驱动IO相关的设置

对该文件i-node对象的引用。

 

每个文件系统都会为驻留其上的所有文件建立一个i-node表。以后将详细讨论i-node结构和文件系统的总体结构。每个文件的i-node信息,有以下:

文件类型(例如,常规文件、套接字或FIFO)和访问权限。

一个指针,指向该文件所持有的锁的列表。

文件的各种属性,包括文件大小以及与不同类型操作相关的时间戳。

 

此处将忽略i-node在磁盘和内存中的表示差异。磁盘上的i-node记录了文件的固有属性,诸如:文件类型、访问权限和时间戳。访问一个文件时,会在内存中为i-node创建一个副本,其中记录了引用该i-node的打开文件句柄数量以及i-node所在设备的主、从设备号,还包括一些打开文件时与文件相关的临时属性,例如:文件锁。

 

下图展示了文件描述符、打开的文件句柄以及i-node之间的关系。在下图中,两个进程拥有诸多打开的文件描述符。

 

Unix系统编程()文件描述符和打开文件之间的关系

 

在进程A中,文件描述符1和20都指向同一个打开的文件句柄(标号为23号)。这可能是通过调用dup、dup2或fcntl而形成的。

 

进程A的文件描述符2和进程B的文件描述符2都指向同一个打开的文件句柄(标号为73号)。这种情形可能在fork调用之后出现(即进程A和进程B是父子关系),或者当某进程通过UNIX套接字将一个打开的文件描述符传给另一个进程。

 

此外进程A的描述符0和进程B的描述符3分别指向不同的打开文件的句柄,但这些句柄均指向i-node表中的相同条目(1976),换言之,指向同一个文件。发生这种情况是因为每个进程各自对同一文件发起了open调用。同一个进程两次打开同一文件,也会发生这种情况。

 

 

结论:

两个不同的文件描述符,若指向同一个打开文件的句柄,将共享同一文件偏移量。因此,如果通过其中一个文件描述符来修改文件偏移量(由调用read、write或者lseek所致),那么从另一文件描述符中也会观察到这一变化。无论这两个文件描述符分别属于不同进程还是属于同一个进程,情况都是如此。

 

要获取和修改打开的文件标志(例如O_APPEND、O_NONBLOCK和O_ASYNC),可以执行fcntl的F_GETFL和F_SETFL操作,其对作用于的约束与上一条颇为类似。

 

相比之下,文件描述符标志(close-on-exec)为进程和描述符所私有。这一标志的修改不会影响同一个进程或不同进程中的其他文件描述符。