系统级I/O 第八周11.1~11.8

时间:2024-09-02 08:04:37

第十章 系统级I/O

  • 输入输出I/O是在主存和外部设备(如磁盘,网络和终端)之间拷贝数据的过程。输入就是从I/O设备拷贝数据到主存,而输出就是从主存拷贝数据到I/O设备。
  • 所有语言的运行时系统都提供执行I/O的较高级别的工具。
  • 学习Unix I/O原因:1.了解Unix I/O将帮助你理解其他的系统概念。2.有时你除了使用Unix I/O外别无选择。

10.1unix i/o

一个Unix文件就是一个m个字节的序列。所有的I/O设备,如网络、磁盘和终端,都被模型化为文件,而所有的输入和输出都被当做对相应的文件的读和写来执行。这种将设备优雅地映射为文件的方式,允许Unix内核引出一个简单、低级的的应用接口,称为Unⅸ I/O,这使得所有的输入和输出都能以一种统一且一致的方式来执行:

  • 打开文件。一个应用程序通过要求内核打开相应的文件,来宣告它想要访问一个I/O设备。
  • 改变当前的文件位置。
  • 读写文件。一个读操作就是从文件拷贝n>0个字节到存储器,从当前文件位置k开始,然后将k增加到k+n。
  • 关闭文件。当应用完成了对文件的访问之后,它就通知内核关闭这个文件。

10.2打开和关闭文件

  • 进程是通过调用open函数来打开一个已存在的文件或者创建一个新文件:
    系统级I/O 第八周11.1~11.8

  • flags参数表示进程打算如何访问这个文件,它的值包括:

  • O_RDONLY:只读
  • O_WRONLY:只写
  • O_RDWR:可读可写
  • mode参数指定了新文件的访问权限位。作为上下文的一部分,每个进程都有一个umask它是通过调用umask函数来设置的。

10.3读和写文件

应用程序是通过分别调用系统函数 read和write函数来执行输入和输出的。
系统级I/O 第八周11.1~11.8

read和write传送的字节比应用程序要求的要少。这些不足值不表示有错误。出现这种情况的可能的原因有:

  • 读时遇到EOF
  • 从终端读文本行
  • 读和写网络套接字

10.4用rio包健壮地读写

RIO提供了两类不同的函数:

  • 无缓冲的输入输出函数
  • 带缓冲的输入函数

10.4.1rio的无缓冲的输入输出函数

  • 通过调用rio_readn和rio_writen函数,应用程序可以在储存器和文件之间直接传送数据。
  • rio_readn函数从描述符fd的当前文件位置最多传送n个字节到存储器位置usrbuf。类似的rio_writen函数从位置usrbuf传送n个字节到描述符fd。rio_readn函数在遇到EOF时只能返回一个不足值。rio_writen函数绝不会返回不足值。

10.4.2rio的带缓冲的输入函数

  • 在带缓冲区的版本中,每打开一个描述符都会调用一次rio_readinitb函数,它将描述符fd和地址rp处的一个类型为rio_t的读缓冲区联系起来。
  • rio_readinitb函数从文件rp读取一个文本行(包括结尾的换行符),将它拷贝到存储器位置usrbuf,并且用空字符来结束这个文本行。
  • RIO读程序的核心是rio_read函数,rio_read函数可以看成是Unix read函数的带缓冲区的版本。当调用rio_read要求读取n个字节的时候,读缓冲区内有rp->rio_cnt个未读的字节。如果缓冲区为空的时候,就会调用read系统函数去填满缓冲区。这个read调用收到一个不足值的话并不是一个错误,只不过读缓冲区的是填充了一部分。
  • 一旦缓冲区非空,rio_read就从读缓冲区拷贝n和rp->rio_cnt中较小值个字节到用户缓冲区,并返回拷贝字节的数目。
  • 对于应用程序来说,rio_read和系统调用read有着相同的语义。出错时返回-1;在EOF时,返回0;如果要求的字节超过了读缓冲区内未读的字节的数目,它会返回一个不足值。rio_readlineb函数多次调用rio_read函数。每次调用都从读缓冲区返回一个字节,然后检查这个字节是否是结尾的换行符。

10.5读取文件元数据

  • 应用程序能够通过调用stat和fstat函数,检索到关于文件的信息。(有时也称为元数据。)
  • stat函数以一个文件名作为输入,填写如图数据结构中的各个成员。
    系统级I/O 第八周11.1~11.8

  • st_size成员包含了文件的字节数大小。st_mode成员则编码了文件访问许可位和文件类型。Unix识别大量不同的文件类型。普通文件包括某种类型的二进制或文本数据。对于内核而言,文本文件和二进制文件毫无区别。

10.6共享文件

内核用三个相关数据结构来表示打开的文件:

  • 描述符表
  • 文件表
  • v-node表

10.7i/o重定向

  • Unix外壳提供了I/O重定向操作符,允许用户将磁盘文件和标准输入输出联系起来。
  • I/O重定向的工作方式: 一种是使用dup2函数。

10.8标准i/o

ANSI C定义了一组高级输入输出函数,成为标准I/O库,为程序员提供了Unix I/O的较高级别的替代。

标准I/O库将一个打开的文件模型化为一个流。

系统级I/O 第八周11.1~11.8

10.9综合:我该使用哪些i/o函数

  • 我们在这一章讨论过的各种I/O包:
    系统级I/O 第八周11.1~11.8

10.10小结

  • Unix提供了少量的系统级函数,它们允许应用程序打开、关闭、读和写文件,提取文件的元数据,以及执行I/O重定向。
  • Unix内核使用三个相关的数据结构来表示打开的文件。
  • 标准I/O库是基于Unix I/O实现的,并提供了一组强大的高级I/O例程,对于大多数应用程序而言,标准I/O更简单,是优于Unix I/O的选择。

参考资料:

1.《深入理解计算机系统》