非节点主机通过内网远程管理docker swarm集群

时间:2021-11-15 05:12:50

这是今天使用 docker swarm 遇到的一个问题,终于在睡觉前解决了,在这篇随笔中记录一下。

在 docker swarm 集群的 manager 节点上用 docker cli 命令可以正常管理集群。但是在另外一台不是集群节点的主机上,虽然设置了DOCKER_HOST环境变量

export DOCKER_HOST="tcp://manger节点内网IP:2377"

但连接不上

# docker ps
Cannot connect to the Docker daemon at tcp://x.x.x.x:2377. Is the docker daemon running?

后来在 CoreOS 网站上找到了解决方法 - Customizing docker

1. 创建 /etc/systemd/system/docker-tcp.socket 文件并添加下面的配置

[Unit]
Description=Docker Socket for the API
PartOf=docker.service [Socket]
ListenStream=x.x.x.x:2375
BindIPv6Only=both
Service=docker.service [Install]
WantedBy=sockets.target

注:上面的 x.x.x.x 是 manager 节点的内网 IP 地址

2. 重启相关服务使设置生效

systemctl enable docker-tcp.socket
systemctl stop docker
systemctl start docker-tcp.socket
systemctl start docker

或者

systemctl enable docker-tcp.socket && systemctl stop docker && systemctl start docker-tcp.socket && systemctl start docker

3. 设置 DOCKER_HOST 环境变量

export DOCKER_HOST="tcp://manger节点内网IP:2375"

或者直接

docker -H tcp://manger节点内网IP:2375 ps

就可以连接并正常远程管理 docker swarm 集群了。

注:一定要添加 PartOf=docker.service ,不然服务器重启后,docker-tcp.socket 不会自动启动。