15 操作系统第四章文件管理文件的物理结构文件存储空间管理

1 文件的物理结构（文件分配方式）

1.1 文件块、磁盘块

类似于内存分页，磁盘中的存储单元也会被分为一个个“块/磁盘块/物理块”。很多操作系统中，磁盘块的大小与内存块、页面的大小相同

在内存管理中，进程的逻辑地址空间被分为一个一个页面同样的，在外存管理中，为了方便对文件数据的管理，文件的逻辑地址空间也被分为了一个一个的文件“块”。于是文件的逻辑地址也可以表示为（逻辑块号，块内地址）的形式。
15 操作系统第四章文件管理文件的物理结构文件存储空间管理

1.2 文件分配方式——连续分配

连续分配方式要求每个文件在磁盘上占有一组连续的块。

问题：用户通过逻辑地址来操作自己的文件，操作系统如何实现从逻辑地址到物理地址的映射？
（逻辑块号，块内地址）→（物理块号，块内地址）。只需转换块号就行，块内地址保持不变

用户给出要访问的逻辑块号，操作系统找到该文件对应的目录项（FCB）…

当然，还需要检查用户提供的逻辑块号是否合法（逻辑块号≥ 长度就不合法）
可以直接算出逻辑块号对应的物理块号，物理块号=起始块号+逻辑块号
因此连续分配支持顺序访问和直接访问（即随机访问）

连续分配读取某个磁盘块时，需要移动磁头。访问的两个磁盘块相隔越远，移动磁头所需时间就越长。

结论：

连续分配的文件在顺序读/写时速度最快

物理上采用连续分配的文件不方便拓展。

物理上采用连续分配，存储空间利用率低，会产生难以利用的磁盘碎片
可以用紧凑来处理碎片，但是需要耗费很大的时间代价。

连续分配优缺点总结：

优点：支持顺序访问和直接访问（即随机访问）；连续分配的文件在顺序访问时速度最快
缺点：不方便文件拓展；存储空间利用率低，会产生磁盘碎片

1.3 文件分配方式——链接分配

链接分配采取离散分配的方式，可以为文件分配离散的磁盘块。分为隐式链接和显式链接两种。

1.3.1 链接分配——隐式链接

15 操作系统第四章文件管理文件的物理结构文件存储空间管理
问题1：隐式链接如何实现文件的逻辑块号到物理块号的转变？

用户给出要访问的逻辑块号i，操作系统找到该文件对应的目录项（FCB）…

从目录项中找到起始块号（即0号块），将0 号逻辑块读入内存，由此知道1号逻辑块存放的物理块号，于是读入1号逻辑块，再找到2号逻辑块的存放位置……以此类推。

因此，读入i号逻辑块，总共需要i+1次磁盘 I/O。

结论：采用链式分配（隐式链接）方式的文件，只支持顺序访问，不支持随机访问，查找效率低。另外，指向下一个盘块的指针也需要耗费少量的存储空间。

问题2：是否方便拓展文件？

若此时要拓展文件，则可以随便找一个空闲磁盘块，挂到文件的磁盘块链尾，并修改文件的FCB

结论：采用隐式链接的链接分配方式，很方便文件拓展。另外，所有的空闲磁盘块都可以被利用，不会有碎片问题，外存利用率高。

隐式链接分配优缺点总结：
隐式链接——除文件的最后一个盘块之外，每个盘块中都存有指向下一个盘块的指针。文件目录包括文件第一块的指针和最后一块的指针。

优点：很方便文件拓展，不会有碎片问题，外存利用率高。
缺点：只支持顺序访问，不支持随机访问，查找效率低，指向下一个盘块的指针也需要耗费少量的存储空间。

1.3.2 链接分配——显式链接

显式链接把用于链接文件各物理块的指针显式地存放在一张表中。即文件分配表（FAT，File Allocation Table）

假设某个新创建的文件“aaa”依次存放在磁盘块2→5→0→1
假设某个新创建的文件“bbb”依次存放在磁盘块4→23→3
则FAT表如下：

注意：一个磁盘仅设置一张FAT。开机时，将FAT读入内存，并常驻内存。FAT 的各个表项在物理上连续存储，且每一个表项长度相同，因此“物理块号”字段可以是隐含的。

问题1：如何实现文件的逻辑块号到物理块号的转变？

用户给出要访问的逻辑块号i，操作系统找到该文件对应的目录项（FCB）…

从目录项中找到起始块号，若i>0，则查询内存中的文件分配表FAT，往后找到i号逻辑块对应的物理块号。逻辑块号转换成物理块号的过程不需要读磁盘操作。

结论：采用链式分配（显式链接）方式的文件，支持顺序访问，也支持随机访问（想访问i号逻辑块时，并不需要依次访问之前的0~i-1号逻辑块），由于块号转换的过程不需要访问磁盘，因此相比于隐式链接来说，访问速度快很多。
显然，显式链接也不会产生外部碎片，也可以很方便地对文件进行拓展。

1.3.3 链接分配（总结）

隐式链接——除文件的最后一个盘块之外，每个盘块中都存有指向下一个盘块的指针。文件目录包括文件第一块的指针和最后一块的指针。
优点：很方便文件拓展，不会有碎片问题，外存利用率高。
缺点：只支持顺序访问，不支持随机访问，查找效率低，指向下一个盘块的指针也需要耗费少量的存储空间。

显式链接——把用于链接文件各物理块的指针显式地存放在一张表中，即文件分配表（FAT，File AllocationTable）。一个磁盘只会建立一张文件分配表。开机时文件分配表放入内存，并常驻内存。
优点：很方便文件拓展，不会有碎片问题，外存利用率高，并且支持随机访问。相比于隐式链接来说，地址转换时不需要访问磁盘，因此文件的访问效率更高。
缺点：文件分配表的需要占用一定的存储空间。

考试题目中遇到未指明隐式/显式的“链接分配”，默认指的是隐式链接的链接分配

1.4 文件分配方式——索引分配

索引分配允许文件离散地分配在各个磁盘块中，系统会为每个文件建立一张索引表，索引表中记录了文件的各个逻辑块对应的物理块（索引表的功能类似于内存管理中的页表——建立逻辑页面到物理页之间的映射关系）。索引表存放的磁盘块称为索引块。文件数据存放的磁盘块称为数据块。

假设某个新创建的文件“aaa”的数据依次存放在磁盘块2→5→13→9。 7号磁盘块作为“aaa”的索引块，索引块中保存了索引表的内容。
15 操作系统第四章文件管理文件的物理结构文件存储空间管理

注：在显式链接的链式分配方式中，文件分配表FAT 是一个磁盘对应一张。而索引分配方式中，索引表是一个文件对应一张。

可以用固定的长度表示物理块号（如：假设磁盘总容量为1TB=2⁴⁰B，磁盘块大小为1KB，则共有2³⁰个磁盘块，则可用4B表示磁盘块号），因此，索引表中的“逻辑块号”可以是隐含的。

问题：索引分配如何实现文件的逻辑块号到物理块号的转换？

用户给出要访问的逻辑块号i，操作系统找到该文件对应的目录项（FCB）…

从目录项中可知索引表存放位置，将索引表从外存读入内存，并查找索引表即可只i号逻辑块在外存中的存放位置。

可见，索引分配方式可以支持随机访问。文件拓展也很容易实现（只需要给文件分配一个空闲块，并增加一个索引表项即可）但是索引表需要占用一定的存储空间

若每个磁盘块1KB，一个索引表项4B，则一个磁盘块只能存放1024/4=256个索引项

如果一个文件的大小超过了256 块，也就意味着这个文件对应的索引表超过了256个索引项，那么一个磁盘块是装不下文件的整张索引表的，如何解决这个问题？
解决方案：①链接方案 ②多层索引 ③混合索引

1.4.1 链接方案

链接方案：如果索引表太大，一个索引块装不下，那么可以将多个索引块链接起来存放

假设磁盘块大小为1KB，一个索引表项占4B，则一个磁盘块只能存放1024/4=256个索引项。
若一个文件大小为256X256KB= 65,536KB=64MB 该文件共有256X256个块，也就对应 256X256个索引项，也就需要256个索引块来存储，这些索引块用链接方案连起来。若想要访问文件的最后一个逻辑块，就必须找到最后一个索引块（第256 个索引块），而各个索引块之间是用指针链接起来的，因此必须先顺序地读入前255个索引块。
这显然是很低效的。如何解决呢？

1.4.2 多层索引

多层索引：建立多层索引（原理类似于多级页表）。使第一层索引块指向第二层的索引块。还可根据文件大小的要求再建立第三层、第四层索引块。

假设磁盘块大小为1KB，一个索引表项占4B，则一个磁盘块只能存放256个索引项。
若某文件采用两层索引，则该文件的最大长度可以到256X256X1KB=65,536KB=64MB
最大长度：第一级索引表最多有256个索引项，也就是会指向256个第二季索引表，而第二级索引表最多也是256个索引项，每个索引项分别指向一个数据块，数据块大小1KB，则采用两层索引，文件最大256X256X1KB=65,536KB=64MB

可根据逻辑块号算出应该查找索引表中的哪个表项。如：要访问1026号逻辑块，则 1026/256=4，1026%256=2
1026/256=4说明1026号逻辑块对应的索引项是4号二级索引表中存放的
1026%256=2 则需要查询4号索引表中的2号表项

因此可以先将一级索引表调入内存，查询4号表项，将其对应的二级索引表调入内存，再查询二级索引表的2号表项即可知道1026号逻辑块存放的磁盘块号了。访问目标数据块，需要3次磁盘I/O。第一次读入一级索引表，第二次读入二级索引表，第三次读入最终要访问的数据块。

若采用三层索引，则文件的最大长度为256X256X256X1KB=16GB
类似的，访问目标数据块，需要4次磁盘I/O

重要结论：若采用多层索引，则各层索引表大小不能超过一个磁盘块

采用K层索引结构，且*索引表未调入内存，则访问一个数据块只需要K+1次读磁盘操作

1.4.3 混合索引

混合索引：多种索引分配方式的结合。例如，一个文件的*索引表中，既包含直接地址索引（直接指向数据块），又包含一级间接索引（指向单层索引表）、还包含两级间接索引（指向两层索引表）。

由上可见：
若*索引表还没读入内存
访问0~7号逻辑块：两次读磁盘
访问8~263：三次读磁盘盘次数。
访问264~65799：因次读磁盘
对于小文件，只需较少的读磁盘次数就可以访问目标数据块（一般计算机中小文件更多）
这种结构索引支持的最大文件长度为8+256+65536=65800KB→常考混合索引的最大文件长度

1.4.4 索引分配（总结）

索引分配允许文件离散地分配在各个磁盘块中，系统会为每个文件建立一张索引表，索引表中记录了文件的各个逻辑块对应的物理块（索引表的功能类似于内存管理中的页表——建立逻辑页面到物理页之间的映射关系）。

索引表存放的磁盘块称为索引块。文件数据存放的磁盘块称为数据块。若文件太大，索引表项太多，可以采取以下三种方法解决：

链接方案：如果索引表太大，一个索引块装不下，那么可以将多个索引块链接起来存放。
缺点：若文件很大，索引表很长，就需要将很多个索引块链接起来。想要找到i号索引块，必须先依次读入0~i-1 号索引块，这就导致磁盘I/O次数过多，查找效率低下。

多层索引：建立多层索引（原理类似于多级页表）。使第一层索引块指向第二层的索引块。还可根据文件大小的要求再建立第三层、第四层索引块。采用K层索引结构，且*索引表未调入内存，则访问一个数据块只需要K+1次读磁盘操作。
缺点：即使是小文件，访问一个数据块依然需要K+1次读磁盘。

混合索引：多种索引分配方式的结合。例如，一个文件的*索引表中，既包含直接地址索引（直接指向数据块），又包含一级间接索引（指向单层索引表）、还包含两级间接索引（指向两层索引表）。
优点：对于小文件来说，访问一个数据块所需的读磁盘次数更少。

超级超级超级重要考点：

要会根据多层索引、混合索引的结构计算出文件的最大长度（Key：各级索引表最大不能超过一个块）；
要能自己分析访问某个数据块所需要的读磁盘次数（Key：FCB中会存有指向*索引块的指针，因此可以根据FCB读入*索引块。每次读入下一级的索引块都需要一次读磁盘操作。另外，要注意题目条件——*索引块是否已调入内存）

1.5 文件分配总结

15 操作系统第四章文件管理文件的物理结构文件存储空间管理

2 文件存储空间管理

15 操作系统第四章文件管理文件的物理结构文件存储空间管理

2.1 存储空间的划分与初始化

安装Windows操作系统的时候，一个必经步骤是为磁盘分区（C盘、D盘、E盘等）

存储空间的划分：将物理磁盘划分为一个个文件卷（逻辑卷、逻辑盘）
15 操作系统第四章文件管理文件的物理结构文件存储空间管理

2.2 存储空间管理——空闲表法

适用于“连续分配方式”

某时刻磁盘使用如下：

对应的空闲表：

第一个空闲盘块号	空闲盘块数
0	2
5	1
10	5
18	3
23	1

空闲分区表

如何分配磁盘块：

与内存管理中的动态分区分配很类似，为一个文件分配连续的存储空间。同样可采用首次适应、最佳适应、最坏适应等算法来决定要为文件分配哪个区间。

如何回收磁盘块：

与内存管理中的动态分区分配很类似，当回收某个存储区时需要有四种情况:
（1）回收区的前后都没有相邻空闲区；
（2）回收区的前后都是空闲区；
（3）回收区前面是空闲区；
（4）回收区后面是空闲区。
总之，回收时需要注意表项的合并问题。

2.3 存储空间管理——空闲链表法

15 操作系统第四章文件管理文件的物理结构文件存储空间管理

空闲盘块链：

操作系统保存着链头、链尾指针。
如何分配：若某文件申请K个盘块，则从链头开始依次摘下K个盘块分配，并修改空闲链的链头指针。
如何回收：回收的盘块依次挂到链尾，并修改空闲链的链尾指针。

特点：适用于离散分配的物理结构。为文件分配多个盘块时可能要重复多次操作

空闲盘区链：

操作系统保存着链头、链尾指针。
如何分配：若某文件申请K个盘块，则可以采用首次适应、最佳适应等算法，从链头开始检索，按照算法规则找到一个大小符合要求的空闲盘区，分配给文件。若没有合适的连续空闲块，也可以将不同盘区的盘块同时分配给一个文件，注意分配后可能要修改相应的链指针、盘区大小等数据。
如何回收：若回收区和某个空闲盘区相邻，则需要将回收区合并到空闲盘区中。若回收区没有和任何空闲区相邻，将回收区作为单独的一个空闲盘区挂到链尾。

特点：离散分配、连续分配都适用。为一个文件分配多个盘块时效率更高

2.4 存储空间管理一一位示图法

位示图：每个二进制位对应一个盘块。

某时刻磁盘利用情况如下：

对应的位示图：

在本例中，“0”代表盘块空闲，“1”代表盘块已分配。位示图一般用连续的“字”来表示，如本例中一个字的字长是16位，字中的每一位对应一个盘块。因此可以用（字号，位号）对应一个盘块号。当然有的题目中也描述为（行号，列号）

重点重点：要能自己推出盘块号与（字号位号）相互转换的公式。
注意题目条件：盘块号、字号、位号到底是从0开始还是从1开始
如本例中盘块号、字号、位号从0开始，若n表示字长，则.
（字号，位号）=（i，j）的二进制位对应的盘块号b=ni+j

本例中：
（0,1）→b=16X0+1
（1,10）→b=16X1+10
b号盘块对应的字号i=b/n，位号j=b%n
b=13→i=13/16=0,j=13%16=13

如何分配：若文件需要K个块，
①顺序扫描位示图，找到K个相邻或不相邻的“0”；
②根据字号、位号算出对应的盘块号，将相应盘块分配给文件；
③将相应位设置为“1”。
如何回收：①根据回收的盘块号计算出对应的字号、位号；②将相应二进制位设为“0”

特点：连续分配、离散分配都适用

2.5 存储空间管理一—成组链接法

空闲表法、空闲链表法不适用于大型文件系统，因为空闲表或空闲链表可能过大。UNIX系统中采用了成组链接法对磁盘空闲块进行管理。
文件卷的目录区中专门用一个磁盘块作为“超级块”，当系统启动时需要将超级块读入内存。并且要保证内存与外存中的“超级块”数据一致。

2.6 文件存储空间管理小结

15 操作系统第四章文件管理文件的物理结构文件存储空间管理

秒客网

15 操作系统第四章文件管理文件的物理结构文件存储空间管理

文章目录

1 文件的物理结构（文件分配方式）

1.1 文件块、磁盘块

1.2 文件分配方式——连续分配

1.3 文件分配方式——链接分配

1.3.1 链接分配——隐式链接

1.3.2 链接分配——显式链接

1.3.3 链接分配（总结）

1.4 文件分配方式——索引分配

1.4.1 链接方案

1.4.2 多层索引

1.4.3 混合索引

1.4.4 索引分配（总结）

1.5 文件分配总结

2 文件存储空间管理

2.1 存储空间的划分与初始化

2.2 存储空间管理——空闲表法

2.3 存储空间管理——空闲链表法

2.4 存储空间管理一一位示图法

2.5 存储空间管理一—成组链接法

2.6 文件存储空间管理小结

相关文章

15 操作系统第四章 文件管理 文件的物理结构 文件存储空间管理

文章目录

1 文件的物理结构 （文件分配方式）

1.1 文件块、磁盘块

1.2 文件分配方式——连续分配

1.3 文件分配方式——链接分配

1.3.1 链接分配——隐式链接

1.3.2 链接分配——显式链接

1.3.3 链接分配（总结）

1.4 文件分配方式——索引分配

1.4.1 链接方案

1.4.2 多层索引

1.4.3 混合索引

1.4.4 索引分配（总结）

1.5 文件分配总结

2 文件存储空间管理

2.1 存储空间的划分与初始化

2.2 存储空间管理——空闲表法

2.3 存储空间管理——空闲链表法

2.4 存储空间管理一一位示图法

2.5 存储空间管理一—成组链接法

2.6 文件存储空间管理小结

相关文章

15 操作系统第四章文件管理文件的物理结构文件存储空间管理

1 文件的物理结构（文件分配方式）