Linux系统下rm删除文件后空间没有释放问题解决办法

时间:2021-05-20 16:15:38

一、问题描述

今日收到zabbix监控报警,发现生产环境一台服务器的磁盘空间不足,需要进行处理,登录后发现可利用率不足20%,进行相关查看和处理工作;但是操作删除了一些备份文件和日志信息后,查看空间仍然不足。

二、具体操作过程

1、检查服务器占用硬盘资源的文件

[root@nc-ftp02 ~]# df -hP
Filesystem      Size  Used Avail Use% Mounted on
/dev/xvda2       99G  4.2G   90G   5% /
tmpfs           3.9G  228K  3.9G   1% /dev/shm
/dev/xvda1      380M   66M  294M  19% /boot
/dev/xvda5      386G  290G   77G  80% /data
[root@nc-ftp02 ~]# cd /data/
[root@nc-ftp02 data]# ls
backup   data_bak  ftp  lost+found    script
[root@nc-ftp02 data]# du -sh *
4.1G	backup
12G	data_bak
813M	ftp
16K	lost+found
5.0G	nchome
16K	script 

注意:查看后,发现data目录下,并无大文件存在,备份目录下面只保留了2个月的数据,所以问题依旧存在。

这时想起来,在Linux或者Unix系统中,通过rm或者文件管理器删除文件将会从文件系统的文件夹结构上解除链接(unlink).然而假设文件是被打开的(有一个进程正在使用),那么进程将仍然能够读取该文件,磁盘空间也一直被占用。而我删除的是备份和log文件删除的时候文件应该正在被使用;

2、查看删除文件被占用的具体情况

[root@nc-ftp02 data]# lsof -n /data |grep deleted   
sh         8757 root    1w   REG  202,5 287246420690       12 /data/nohup.out (deleted)
sh         8757 root    2w   REG  202,5 287246420690       12 /data/nohup.out (deleted)
rsync     28485 root    1w   REG  202,5 287246420690       12 /data/nohup.out (deleted)
rsync     28485 root    2w   REG  202,5 287246420690       12 /data/nohup.out (deleted)
ssh       28486 root    2w   REG  202,5 287246420690       12 /data/nohup.out (deleted)
ssh       28486 root    6w   REG  202,5 287246420690       12 /data/nohup.out (deleted)
[root@nc-ftp02 data]# lsof -n /data |grep deleted|awk '{print $2}'
8757
8757
28674
28674
28675
28675
[root@nc-ftp02 data]# lsof -n /data |grep deleted|awk '{print $2}'|xargs kill -9
[root@nc-ftp02 data]# lsof -n /data |grep deleted
[root@nc-ftp02 data]# df -h
Filesystem      Size  Used Avail Use% Mounted on
/dev/xvda2       99G  4.2G   90G   5% /
tmpfs           3.9G  228K  3.9G   1% /dev/shm
/dev/xvda1      380M   66M  294M  19% /boot
/dev/xvda5      386G   22G  345G   6% /data

3、如何让进程释放?

一种方法是kill掉相应的进程,另一种就是停掉使用这个文件的应用,让os自己主动回收磁盘空间。

3.1、如果系统管理员能够熟悉该服务器上相关应用部署和配置,可以通过第一种方法进行释放,我在操作过程,采用的就是kill掉应用中不使用的进程来释放空间;

当linux打开一个文件的时候,Linux内核会为每个进程在/proc/ 『/proc/nnnn/fd/文件夹(nnnn为pid)』建立一个以其pid
为名的文件夹用来保存进程的相关信息,而其子文件夹fd保存的是该进程打开的全部文件的fd(fd:file descriptor)。

kill进程是通过截断proc文件系统中的文件能够强制要求系统回收分配给正在使用的的文件。
仅到管理员确定不会对执行中的进程造成影响时使用。应用程序对这样的方
式支持的并不好,当一个正在使用的文件被截断可能会引发不可预知的问题

3.2、如果环境有非常多进程在使用的这个文件,停掉进程可能带来一定风险,又不在系统管理员控制范围内,建议不要轻易使用kill进行操作;最好原则合适时间停掉相关应用进行释放。
综上所述,问题解决!

---------------------------------------------书山有路勤为径,学海无涯苦作舟--------------------------------------------------------