Linux系统下rm删除文件后空间没有释放问题解决办法

时间:2023-03-08 16:48:22
Linux系统下rm删除文件后空间没有释放问题解决办法

一、问题描述

今日收到zabbix监控报警,发现生产环境一台服务器的磁盘空间不足,需要进行处理,登录后发现可利用率不足20%,进行相关查看和处理工作;但是操作删除了一些备份文件和日志信息后,查看空间仍然不足。

二、具体操作过程

1、检查服务器占用硬盘资源的文件

[root@nc-ftp02 ~]# df -hP
Filesystem Size Used Avail Use% Mounted on
/dev/xvda2 99G 4.2G 90G 5% /
tmpfs 3.9G 228K 3.9G 1% /dev/shm
/dev/xvda1 380M 66M 294M 19% /boot
/dev/xvda5 386G 290G 77G 80% /data
[root@nc-ftp02 ~]# cd /data/
[root@nc-ftp02 data]# ls
backup data_bak ftp lost+found script
[root@nc-ftp02 data]# du -sh *
4.1G backup
12G data_bak
813M ftp
16K lost+found
5.0G nchome
16K script 

注意:查看后,发现data目录下,并无大文件存在,备份目录下面只保留了2个月的数据,所以问题依旧存在。

这时想起来,在Linux或者Unix系统中,通过rm或者文件管理器删除文件将会从文件系统的文件夹结构上解除链接(unlink).然而假设文件是被打开的(有一个进程正在使用),那么进程将仍然能够读取该文件,磁盘空间也一直被占用。而我删除的是备份和log文件删除的时候文件应该正在被使用;

2、查看删除文件被占用的具体情况

[root@nc-ftp02 data]# lsof -n /data |grep deleted
sh 8757 root 1w REG 202,5 287246420690 12 /data/nohup.out (deleted)
sh 8757 root 2w REG 202,5 287246420690 12 /data/nohup.out (deleted)
rsync 28485 root 1w REG 202,5 287246420690 12 /data/nohup.out (deleted)
rsync 28485 root 2w REG 202,5 287246420690 12 /data/nohup.out (deleted)
ssh 28486 root 2w REG 202,5 287246420690 12 /data/nohup.out (deleted)
ssh 28486 root 6w REG 202,5 287246420690 12 /data/nohup.out (deleted)
[root@nc-ftp02 data]# lsof -n /data |grep deleted|awk '{print $2}'
8757
8757
28674
28674
28675
28675
[root@nc-ftp02 data]# lsof -n /data |grep deleted|awk '{print $2}'|xargs kill -9
[root@nc-ftp02 data]# lsof -n /data |grep deleted
[root@nc-ftp02 data]# df -h
Filesystem Size Used Avail Use% Mounted on
/dev/xvda2 99G 4.2G 90G 5% /
tmpfs 3.9G 228K 3.9G 1% /dev/shm
/dev/xvda1 380M 66M 294M 19% /boot
/dev/xvda5 386G 22G 345G 6% /data

3、如何让进程释放?

一种方法是kill掉相应的进程,另一种就是停掉使用这个文件的应用,让os自己主动回收磁盘空间。

3.1、如果系统管理员能够熟悉该服务器上相关应用部署和配置,可以通过第一种方法进行释放,我在操作过程,采用的就是kill掉应用中不使用的进程来释放空间;

当linux打开一个文件的时候,Linux内核会为每个进程在/proc/ 『/proc/nnnn/fd/文件夹(nnnn为pid)』建立一个以其pid
为名的文件夹用来保存进程的相关信息,而其子文件夹fd保存的是该进程打开的全部文件的fd(fd:file descriptor)。

kill进程是通过截断proc文件系统中的文件能够强制要求系统回收分配给正在使用的的文件。
仅到管理员确定不会对执行中的进程造成影响时使用。应用程序对这样的方
式支持的并不好,当一个正在使用的文件被截断可能会引发不可预知的问题

3.2、如果环境有非常多进程在使用的这个文件,停掉进程可能带来一定风险,又不在系统管理员控制范围内,建议不要轻易使用kill进行操作;最好原则合适时间停掉相关应用进行释放。
综上所述,问题解决!

---------------------------------------------书山有路勤为径,学海无涯苦作舟--------------------------------------------------------