这是今天使用 docker swarm 遇到的一个问题,终于在睡觉前解决了,在这篇随笔中记录一下。
在 docker swarm 集群的 manager 节点上用 docker cli 命令可以正常管理集群。但是在另外一台不是集群节点的主机上,虽然设置了DOCKER_HOST环境变量
export DOCKER_HOST="tcp://manger节点内网IP:2377"
但连接不上
# docker ps
Cannot connect to the Docker daemon at tcp://x.x.x.x:2377. Is the docker daemon running?
后来在 CoreOS 网站上找到了解决方法 - Customizing docker:
1. 创建 /etc/systemd/system/docker-tcp.socket 文件并添加下面的配置
[Unit]
Description=Docker Socket for the API
PartOf=docker.service [Socket]
ListenStream=x.x.x.x:2375
BindIPv6Only=both
Service=docker.service [Install]
WantedBy=sockets.target
注:上面的 x.x.x.x 是 manager 节点的内网 IP 地址
2. 重启相关服务使设置生效
systemctl enable docker-tcp.socket
systemctl stop docker
systemctl start docker-tcp.socket
systemctl start docker
或者
systemctl enable docker-tcp.socket && systemctl stop docker && systemctl start docker-tcp.socket && systemctl start docker
3. 设置 DOCKER_HOST 环境变量
export DOCKER_HOST="tcp://manger节点内网IP:2375"
或者直接
docker -H tcp://manger节点内网IP:2375 ps
就可以连接并正常远程管理 docker swarm 集群了。
注:一定要添加 PartOf=docker.service ,不然服务器重启后,docker-tcp.socket 不会自动启动。