因为这个问题也是花费好长时间了,对一个小白的我来说真的挺激动的。下面说一下我的解决思路吧。不过造成这个问题也有很多种原因,需要对症下药。
我入手解决是从这个网站上看到同样的问题,然后通过一个个排除最后确定了自己的问题。(http://www.slac.stanford.edu/comp/unix/package/lsf/LSF5.1_doc/get_started_5.1/troubleshooting2.html)
我的问题是从这里入手的:
- You have a permanent license and the license server daemon (
lmgrd
) is not running. Start the license server as described in Starting the license server daemon (lmgrd).
这里说下,我们安装的lsf是老版本的(7.0),许可证是永久性的,所以通过Flexnet来控制,需要找到lsf对应的license.dat。解决思路如下:
(1)首先确定Flexnet Server是否运行。
(2)通过运行 lmdown -c /public1/apps/lsf/conf/license.dat 查看license.dat文件是否合适,1700端口是否开启。(lmdown意思是关闭Flexnet server,如果能正常关闭,说明license.dat文件合适)
(3)运行 lmstat -c /public1/apps/lsf/conf/license.dat显示lmgrd is not running: Cannot connect to license server (-15,570:111 "Connection refused"),这个错误是由于Flexnet server没有运行的缘故。
(4)运行lmgrd -c /public1/apps/lsf/conf/license.dat 开启Flexnet Server,显示(lmgrd) Failed to open the TCP port number in the license。说明无法启动。
(5)所以就着手解决(lmgrd) Failed to open the TCP port number in the license。这个问题。通过网上查询最终解决,在/etc/hosts文件加入 127.0.0.1 localhost servername 问题便解决了
注:lmgrd最好用lsf管理员运行,不要用root用户运行。