1、描述:
每日一样,例行打开hadoop集群的cloudera manager的管理界面。发现出现了多个bad health的服务。那么出现的这个问题就是查看该服务运行的日志,对应的该服务当中,会包含相应的角色,其中,查看日志的时候可以看每一个角色的运行日志。通过查看日志,发现HBase出现了java.io.IOException: Too many open files错误的问题。
2、问题的解决方法:
通过百度,发现很多人遇到了我同样的问题。通过借鉴。解决的方法如下:
(1) 使用ps -ef |grep java (java代表你程序,查看你程序进程) 查看你的进程ID,记录ID号,假设进程ID为12
(2) 使用:lsof -p 12 | wc -l 查看当前进程id为12的 文件操作状况
执行该命令出现文件使用情况为 1052
(3) 使用命令:ulimit -a 查看每个用户允许打开的最大文件数
发现系统默认的是open files (-n) 1024,问题就出现在这里。
(4) 在系统文件/etc/security/limits.conf中修改这个数量限制,
在文件中加入内容:
* soft nofile 65536
* hard nofile 65536
这样就修改了最大文件数量,注意软限制应该要小于等于硬限制
(5)ulimit -n 4096 这种网上说的方法,用户重新登录后就会回到默认值,不要用这种方法。
3、总结
按照上面描述的方式来操作,再做进一步测试。