linux 句柄数过高的排查方法

时间:2024-04-03 13:17:55

背景:做linux系统上的后端代码开发,偶尔会碰到后台报错:too many file open  XXXX  ,紧跟着是socket open timeout  。这种情况大部分是因为linux 文件句柄数满掉引起的。排查方法如下:


1、linux操作系统默认的句柄数为1024,windows默认的句柄数为6万。所以linux操作系统更容易出现句柄数不够用的情况。但是1024的句柄数在大部分情况下也是够用的,除非这台linux是类似:日志服务器、监控服务器等提供服务,并且被大量IP链接的才需要扩大句柄数(改linux系统参数+重启linux)。

2、当出现linux句柄数满的时候,使用如下命令查询句柄数说被哪个进程占了。如下:

lsof -n|awk '{print $2}'|sort|uniq -c|sort -nr|more

linux 句柄数过高的排查方法


然后运行:ps -ef|grep 12281     (其中12281换为上一个步骤查询到的pid)


linux 句柄数过高的排查方法


如果是java系统的,则可以使用jdk自带的线程导出工具,把全部的线程导出:

jstack -l 12281 >> /usr/local/Client/log20180116.log     (其中12281换为实际的pid)


然后用记事本打开这个文件,看看哪个线程数最高+结合实际业务情况判断是哪段代码出问题了