一、情景:
当CDH集群初次启动后,过了一段时间,然后再重启其中组件时,不能启动,cm界面报Unknow错误。
二、错误信息:
UNKNOW
三、分析:
1、了解cloudera manager的工作原理
2、判断是哪个工作流程出问题
3、查看cloudera agent和zookeeper的日志
四、解决方法:
supervisord进程杀死!!!
即执行service cloudera-scm-agent stop 后,需要ps -ef | grepsupervisord,然后kill -9 这个pid,最后service cloudera-scm-agent start !!!
就会发现,再次重启zookeeper或者其他组件时,OK了。。。
花了1天的时间,终于解决了。。。