今天公司的测试hadoop集群,ambari 出现问题。特此总结。
公司的集群用的是hortonworks的hdp2.4,ambari2.2 版本的。 服务器版本是Redhat6.4。
1. 问题描述:
今天发现集群中的一台节点上的ambari-agent连接失败,进而导致该节点上的其他服务都管理不到。该节点还是主要的节点。
查看日志发现可能是该节点上安装的python版本冲突的问题。
这个是启动的时候报的错误。 因为ambari-agent我最后重装了,日志文件已经丢失没办法贴出来,只贴出来了这个之前记下的启动问题。
[root@Master ~]# ambari-agent start
Verifying Python version compatibility...
Using python /usr/bin/python2
Checking for previously running Ambari Agent...
/usr/sbin/ambari-agent: line 74: ambari-sudo.sh: command not found
/usr/sbin/ambari-agent: line 76: ambari-sudo.sh: command not found
/usr/sbin/ambari-agent: line 77: ambari-sudo.sh: command not found
/usr/sbin/ambari-agent: line 78: ambari-sudo.sh: command not found
/usr/sbin/ambari-agent: line 79: ambari-sudo.sh: command not found
/usr/sbin/ambari-agent: line 80: ambari-sudo.sh: command not found
/usr/sbin/ambari-agent: line 81: ambari-sudo.sh: command not found
Starting ambari-agent
Verifying ambari-agent process status...
ERROR: ambari-agent start failed. For more details, see /var/log/ambari-agent/ambari-agent.out:
====================
/usr/bin/python2: can't open file '/usr/lib/python2.6/site-packages/ambari_agent/AmbariAgent.py': [Errno 2] No such file or directory
====================
Agent out at: /var/log/ambari-agent/ambari-agent.out
Agent log at: /var/log/ambari-agent/ambari-agent.log
2. 查看日志发现日志里面提示系统装的python版本是2.7, 而ambari启动时,是去2.6的目录下找的文件。好像还是用2.6版本的python启动的。
3.用了rpm -qa | grep -i pyt* 命令。找到了好多python相关的安装包,但是就是没有2.7的。 用whereis python命令发现,该节点上不仅有python2.6,还有2.7,还有2.8。
系统开始带的也是2.6,可能是之前的人升级的2.7。 但是因为我不知道python2.7的环境变量路径在哪,所以我也没去改。这点等会再查查。
用笨方法把2.7,2.8的目录都删了。 然后又编译方式安装了2.6. 因为yum配置的有问题,我着急,没去改,所以没办法用yum 源安装。(redhat的yum问题等会写另外一篇博客)
4.重新安装了一下python后。 查看系统python 的版本,发现是2.6了。
命令 python -V
5. 因为ambari是采用本地离线安装的方式安装的,所以 yum remove ambari-agent 删了ambari-agent,再重新安装了一下。
6. 然后 ambari-agent start 启动agent。 过了一会,发现ambari管理页面上,agent节点又上线了。把上面的服务重新开启。发现好了。
------------------------------------------------------------------------------------
第一次在CSDN 上写博客。 在新公司负责大数据这块的东西,公司的产品后台还不够熟悉。自己的能力还有点差。所以还有很长的路要走。
公司用的是HDP,网上资料很少。 都是用谷歌浏览器查问题,然后翻译页面。
以后尽量坚持写博客,总结。。。。。。
路漫漫其修远兮,吾将上下而求索
与大家共勉。