Linux文件——inode,软链接,硬链接

时间:2021-02-25 05:16:22

转自:
http://www.ruanyifeng.com/blog/2011/12/inode.html
http://hi.baidu.com/leejun_2005/blog/item/d9aa13a53b3af6e99152ee7e.html
http://blog.51cto.com/13520924/2092364
https://blog.csdn.net/u013071953/article/details/70158381

inode是什么

理解inode,要从文件储存说起。
文件储存在硬盘上,硬盘的最小存储单位叫做”扇区”(Sector)。每个扇区储存512字节(相当于0.5KB)。

操作系统读取硬盘的时候,不会一个个扇区地读取,这样效率太低,而是一次性连续读取多个扇区,即一次性读取一个”块”(block)。这种由多个扇区组成的”块”,是文件存取的最小单位。”块”的大小,最常见的是4KB,即连续八个 sector组成一个 block。

文件数据都储存在”块”中,那么很显然,我们还必须找到一个地方储存文件的元信息,比如文件的创建者、文件的创建日期、文件的大小等等。这种储存文件元信息的区域就叫做inode,中文译名为”索引节点”。

inode包含的信息

inode包含文件的元信息,具体来说有以下内容:

  • 文件的字节数。
  • 文件拥有者的User ID。
  • 文件的Group ID。
  • 文件的读、写、执行权限。
  • 文件的时间戳,共有三个:ctime指inode上一次变动的时间,mtime指文件内容上一次变动的时间,atime指文件上一次打开的时间。
  • 链接数,即有多少文件名指向这个inode。
  • 文件数据block的位置。

    可以用stat命令,查看某个文件的inode信息:

[root@localhost tmp]# stat test
  File: `test'
  Size: 24          Blocks: 8          IO Block: 4096   regular file
Device: fd00h/64768d    Inode: 926505      Links: 2
Access: (0644/-rw-r--r--) Uid: ( 0/ root) Gid: ( 0/ root)
Access: 2018-06-01 21:32:10.652496029 +0800
Modify: 2018-06-01 21:32:05.427503174 +0800
Change: 2018-06-01 21:32:05.427503174 +0800

总之,除了文件名以外的所有文件信息,都存在inode之中。

大部分的Linux文件系统(如ext2、ext3)规定,一个文件由目录项、inode和数据块组成:

  • 目录项:包括文件名和inode节点号。
  • Inode:又称文件索引节点,包含文件的基础信息以及数据块的指针。
  • 数据块:包含文件的具体内容。

请看文件存储结构示意图:
Linux文件——inode,软链接,硬链接

inode的大小

inode也会消耗硬盘空间,所以硬盘格式化的时候,操作系统自动将硬盘分成两个区域。一个是数据区,存放文件数据;另一个是inode区(inode table),存放inode所包含的信息。

每个inode节点的大小,一般是128字节或256字节。inode节点的总数,在格式化时就给定,一般是每1KB或每2KB就设置一个inode。假定在一块1GB的硬盘中,每个inode节点的大小为128字节,每1KB就设置一个inode,那么inode table的大小就会达到128MB,占整块硬盘的12.8%。

查看每个硬盘分区的inode总数和已经使用的数量,可以使用df -i命令。

查看每个inode节点的大小,可以用如下命令:

[root@localhost tmp]# dumpe2fs -h /dev/sda1 | grep "Inode size"
dumpe2fs 1.41.12 (17-May-2010)
Inode size:           128

由于每个文件都必须有一个inode,因此有可能发生inode已经用光,但是硬盘还未存满的情况。这时,就无法在硬盘上创建新文件。
可以使用df -i命令查看节点使用情况。

inode号码

每个inode都有一个号码,操作系统用inode号码来识别不同的文件。

这里值得重复一遍,Unix/linux系统内部不使用文件名,而使用inode号码来识别文件。对于系统来说,文件名只是inode号码便于识别的别称或者绰号。

表面上,用户通过文件名,打开文件。实际上,系统内部这个过程分成三步:首先,系统找到这个文件名对应的inode号码;其次,通过inode号码,获取inode信息;最后,根据inode信息,找到文件数据所在的block,读出数据。

使用ls -i命令,可以看到文件名对应的inode号码:
ls -il test
Linux文件——inode,软链接,硬链接

再来了解一下文件系统如何存取文件的

1、根据文件名,通过Directory里的对应关系,找到文件对应的Inode number
2、再根据Inode number读取到文件的Inode table
3、再根据Inode table中的Pointer读取到相应的Blocks

目录项

上述存取文件过程有一个重要的内容,就是Directory,他不是我们通常说的目录,而是一个列表,记录了一个文件/目录名称对应的Inode number。如下图
Linux文件——inode,软链接,硬链接
Linux系统中,目录(directory)也是一种文件。打开目录,实际上就是打开目录文件。

目录文件的结构非常简单,就是一系列目录项(dirent)的列表。每个目录项,由两部分组成:所包含文件的文件名,以及该文件名对应的inode号码。

ls命令只列出目录文件中的所有文件名:
ls /etc
ls -i命令列出整个目录文件,即文件名和inode号码:
ls -i /etc
如果要查看文件的详细信息,就必须根据inode号码,访问inode节点,读取信息。ls -l命令列出文件的详细信息。
ls -l /etc

inode用完但磁盘未满,导致无法新建文件

在一台配置较低的Linux服务器(内存、硬盘比较小)的/data分区内创建文件时,系统提示磁盘空间不足,用df -h命令查看了一下磁盘使用情况,发现/data分区只使用了66%,还有12G的剩余空间,按理说不会出现这种问题。

后来用df -i查看了一下/data分区的索引节点(inode),发现已经用满(IUsed=100%),导致系统无法创建新目录和文件。
Linux文件——inode,软链接,硬链接
而这台服务器的Block虽然还有剩余,但inode已经用满,因此在创建新目录或文件时,系统提示磁盘空间不足。

查找原因:
  /data/cache目录中存在数量非常多的小字节缓存文件,占用的Block不多,但是占用了大量的inode。

解决方案:
  1、删除/data/cache目录中的部分文件,释放出/data分区的一部分inode。

  2、用软连接将空闲分区/opt中的newcache目录连接到/data/cache,使用/opt分区的inode来缓解/data分区inode不足的问题:
  ln -s /opt/newcache /data/cache

通过inode删除文件

查看文件的inode

[root@localhost tmp]# ll -i
total 20
921319 drwxr-xr-x. 3 root root 4096 Jun  1 21:54 dir
921320 lrwxrwxrwx. 1 root root    3 Jun  1 21:13 dir_link -> dir
927196 drwx------. 2 root root 4096 Jun  2 09:25 firefox_root
927199 drwx------. 2 root root 4096 Jan  1  1970 orbit-root
926505 -rw-r--r--. 2 root root   24 Jun  1 21:32 test
926505 -rw-r--r--. 2 root root   24 Jun  1 21:32 test_hard
927193 lrwxrwxrwx. 1 root root    4 Jun  1 21:31 test_soft -> test

删除指定inode对应的文件

[root@localhost tmp]# rm -f `find . -inum 927193`

或者

[root@localhost tmp]#find . -inum 926505 -exec rm -f {} \;

Linux中cp、rm、mv 、ln对inode的影响:

1、cp命令

  • 分配一个未被使用的inode号,在inode表中添加一个新项目,(注意:如果是cp到讴歌已经存在的文件,则inode号采用被覆盖之前的目标文件的inode号,如果对运行中的apache共享模块so文件进行cp操作,就会出现Segmentation fault<段错误>)
  • 在目录中新建一个目录项,并指向步骤1中的inode
  • 把数据复制到block中

2、rm命令

  • 减少链接数量,如果链接数为0,释放inode(inode号也已被重新使用);
  • 如果inode被释放,则数据块放到可用空间列表中;
  • 删除目录中的目录项

3、 mv命令
1.如果mv命令的目标文件和源文件所在的文件系统相同:
使用新文件名建立目录项;
删除带有原来文件名的目录项;
注意:该操作对inode表没有影响(除时间戳),对数据的位置也没有影响,不移动任何数据。(即使是mv到一个已经存在的目标文件,新目录项指源文件inode,会先删除目标文件的目录项,所以如果对运行中的apache的共享模块so文件进行这种操作的话不会有问题,新的so文件inode号变了)
2.如果目标和源文件所在的文件系统不相同,就是cp和rm;

4、 ln命令

  • 符号(软)链接:

    符号链接的内容是它引用文件的名称,可以是任意文件或目录,也可以链接不同问价系统的文件,甚至可以链接不存在的文件,这就产生一般称为断裂的问题,还可以不断的循环链接源文,但是其大小为指向的路径字符串的长度;不增加或减少目标文件inode 的引用计数。

使用ln -s source_file softlink_file (注意:源文件(source_file)的路径是相对路径(也可以是绝对路径,通常使用的是相对路径),一定是相对于软链接文件的路径,而非相对于当前工作目录的路径)创建符号链接,在对符号链接进行读写操作的时候,系统会自动把该操作转换为对源文件的操作,但是删除连接文件时,系统仅仅删除符号链接文件,而不是删除源文件本身。

  • 硬链接:

不允许给目录创建硬链接,创建硬链接会正价额外的记录项以引用文(不能跨驱动或分区创建硬链接),硬链接件对应于同一文件系统上的一个物理文件,硬链接节点编号是相同的,创建硬链接链接数递增,删除文件时:rm命令递减计数的链接,文件如果存在,至少有一个链接数,当链接数为0时,该文件被删除。

  • 硬链接于软连接的区别:

    1、本质不同:硬链接是指向同一个文件,软链接指向的不是同一个文件
    
    2、删除时:硬链接不受影响,软链接失效
    
    3、创建链接时:创建硬链接链接数加1,创建软链接连接数不变
    
    4、是否可以跨分区:硬链接不可以跨分区,软链接可以跨分区
    
    5、目录是否可以创建链接:硬链接不可以对目录创建,软链接可以对目录创建
    
    6、硬链接的inode号相同,软链接inode号不同