整理自《鸟哥的Linux私房菜》,整理者:华科小涛http://www.cnblogs.com/hust-ghtao/
1.文件系统概念引入
文件系统是一种存储和组织计算机数据的方法,它使得对其访问和查找变得容易,文件系统使用文件和树形目录的抽象逻辑概念代替了硬盘和光盘等物理设备使用数据块的概念,用户使用文件系统来保存数据不必关心数据实际保存在硬盘(或者光盘)的地址为多少的数据块上,只需要记住这个文件的所属目录和文件名。在写入新数据之前,用户不必关心硬盘上的那个块地址没有被使用,硬盘上的存储空间管理(分配和释放)功能由文件系统自动完成,用户只需要记住数据被写入到了哪个文件中。
我们都知道磁盘分区后还要进行格式化,之后操作系统才能够使用这个分区。这是因为每种操作系统所设置的文件属性/权限不同,为了存放这些数据所需要的数据,因此就要对分区进行格式化,以成为操作系统能够利用的文件系统格式。
文件数据除了文件的实际内容外,还含有文件权限(RWX)与文件属性(所有者、群组、时间参数等)。文件系统通常会把这两部分数据放到不同的块,权限与属性放置到inode中,至于实际数据则放置到data block中。另外,还有一个Superblock会记录文件的整体信息,包括inode与block的总量、使用量、剩余量等。
每个inode和block都有编号,这三个数据的意义简要的说明如下:
- superblock:记录此文件的整体信息,包括inode/block的总量、使用量、剩余量,以及文件系统的格式与相关信息等;
- inode:记录文件的属性,一个文件占用一个inode,同时记录此文件的数据所在的block号码;
- block:实际记录文件的内容,若文件太大时,会占用多个block。
用于inode和block都有自己的编号,而每个文件都会占有一个inode,inode内则含有文件数据放置的block号码。所以,如果能够找到文件的inode,那么自然就会知道数据存放到哪些block了,也就可以对数据进行读取。
inode/block数据访问示意图:
从此图我们可以看到,文件系统先格式化出inode与block的块,假设一个文件的属性与权限数据存放到inode4中,而inode4又记录了文件数据的实际放置点为2,7,13,15这4个block号码,此时操作系统就可以据此一下子将数据内容读出来。这种数据访问的访问称为“索引式文件系统”。
2.EXT2文件系统
上面的示意图,是将所有的inode和block都放到一起。但是如果文件系统很大时,inode和block的数量就会很多,将它们放在一起就不方便管理了。所以又提出了block group的概念,每个block group内都有独立的inode/block/superblock系统。我们再看一下含有block group的文件系统示意图:
注意,文件系统最前面有一个启动扇区(boot sector),这个启动扇区可以安装引导装在程序(这是个非常nice的设计,如此一来就能够将不同的引导装在程序安装到个别的文件系统的最前端,而不用覆盖掉MBR,这样才能制作出多重引导的环境)。至于每一个block group的主要内容:
2.1 data block
用来放置文件内容的地方,在EXT2文件系统中所支持的block大小有1KB,2KB及4KB。由于block大小的区别,会导致该文件系统能够支持的最大磁盘容量和最大单一文件容量不同。因为block大小而产生的EXT2文件系统限制如下所示:
除此之外对block的限制还包括:(1)原则上,block的大小与数量格式化完就不能变了;(2)每个block内最多只能存放一 个文件的数据;(3)如果文件大于block的大小,则会占用多个block;(4)若文件小于block大小,则该block的剩余空间就不能再用了。
2.2 inode table
inode记录的数据至少有下面这些:(1)该文件的访问模式(RWX);(2)该文件的所有者(owner/group);(3)该文件的大小;(4)该文件创建或状态改变的时间(ctime);(5)最后一次的读取时间(atime);(6)最近修改的时间(mtime);(7)定义文件特性的标志,如SetUID;(8)该文件真正内容的指向。
下面让我们来分析一下inode/block与文件大小的关系。inode大小128B,记录一个block用4B。假设文件很大,将需要很多记录,为了解决这个问题,操作系统将inode记录block号码的区域定义为12个直接、一个间接、一个双间接和一个三间接记录区。如图所示:
我们计算一下这样的inode能指定多少block?我们假设block大小为1KB:
- 12个直接:12*1KB=12KB
- 间接:256*1K=256KB,每条block号码花4B,因此1K大小记录256个。
- 双间接:256*256*1K=256^2KB
- 三间接:256*256*256=256^3KB
- 总额=12个直接+间接+双间接+三间接= 16GB
此时我们知道当文件系统将block格式化为1K时,能够容纳的最大文件为16GB,和前面提到的相一致。但这个方法不能用在2K和4K大小的block的计算中,因为它们还会受到文件系统本身的限制。