docker集群——Mesos集群下的负载均衡marathon-lb

前面的章节介绍了Mesos+Zookeeper+Marathon的Docker管理平台，接下来介绍如何在该平台下构建负载均衡。

默认情况下，mesos marathon会把app发布到随机节点的随机端口上，当mesos slaves和app越来越多的时候，想查找某组app就变得困难。
mesos提供了两个工具：mesos-dns和marathon-lb，他们俩是mesosphere 官网提供的两种服务发现和负载均衡工具，其中：
mesos-dns是一个服务发现工具，marathon-lb不仅是服务发现工具，还是负载均衡工具。

marathon-lb介绍

鉴于Mesos-DNS有如下诸多缺陷：

DNS不能识别服务端口，除非使用DIG的SRV进行直接查询。大多数应用不能立即使用SRV记录
DNS没有快速容错
DNS记录有一个TTL（生存时间），并且Mesos-DNS使用池创建DNS记录，这样SRV记录会稍有滞后
DNS不能提供任何服务健康状态数据
一些应用和库不能正确的处理多个SRV记录。很多情况下查询或许是缓存过的，以及不能按照实际需要被正确的重新装载

所以现在一般不推荐使用Mesos-DNS作为服务发现工具，而是推荐使用marathon-lb，marathon-lb是可以起到与Mesos-DNS同样作用。

Marathon-lb是个基于HAProxy的快速代理和负载均衡。他能为基于TCP和HTTP协议的应用提供代理和负载均衡，此外还支持SSL、健康检查、HTTP压缩、Lua脚本等特性。

Marathon-lb通过Marathon的EventBus可以自动获取Marathon上每个应用的信息，并且能够为每组应用生成HAProxy配置。不同于通过域名机制来发现服务的Mesos-DNS，Marathon-lb是通过servicePort服务端口来发现服务外，另外，还可以通过VHOST来访问服务。

要使用marathonn-lb，每组app必须设置HAPROXY_GROUP标签。
Marathon-lb运行时绑定在各组app定义的服务端口（servicePort，如果app不定义servicePort，marathon会随机分配端口号）上，可以通过marathon-lb所在节点的相关服务端口访问各组app。比如说：marathon-lb部署在slave2，test-app 部署在slave1，test-app 的servicePort是10004，那么可以在slave2的10004端口访问到test-app提供的服务。
由于servicePort非80、443端口（80、443端口已被marathon-lb中的 haproxy独占），对于web服务来说不太方便，可以使用 haproxy虚拟主机解决这个问题：在提供web服务的app配置里增加HAPROXY_{n}_VHOST（WEB虚拟主机）标签，marathon-lb会自动把这组app的WEB集群服务发布在marathon-lb所在节点的80和443端口上，用户设置DNS后通过虚拟主机名来访问。

配置Marathon-lb

首先分别在slave-1、slave-2、slave-3节点机器上拉去marathon-lb镜像：

[root@slave-1 ~]# docker pull mesosphere/marathon-lb

[root@slave-1 ~]# docker images

REPOSITORY                         TAG                 IMAGE ID            CREATED             SIZE

docker.io/nginx                    latest              2f7f7bce8929        12 days ago         107.5 MB

docker.io/tomcat                   latest              a2fbbcebd67e        2 weeks ago         333.9 MB

docker.io/mesosphere/marathon-lb   latest              8fffa444b894        2 weeks ago         181.3 MB

编写marathon-lb的json文件：

[root@master-1 ~]# vim marathon-lb.json

{

"id": "marathon-lb",

"instances": 1,

"constraints": [["hostname", "UNIQUE"]],

"container": {"type": "DOCKER",

"docker": {

"image": "docker.io/mesosphere/marathon-lb",

"privileged": true,

"network": "HOST"

}

},

"args":["sse","-m","http://192.168.93.133:8080","-m","http://192.168.93.134:8080","-m","http://192.168.93.135:8080","--group","external"]

}

也可以通过marathon是访问界面里点击“Create Application”，在“JSON Mode”模式下，将上面marathon-lb.json文件粘贴进去：

docker集群——Mesos集群下的负载均衡marathon-lb

接着编写应用的json，然后构建应用。这里以创建docker的nginx容器应用为例：

[root@master-1 ~]# vim docker_nginx.json

{

  "id":"nginx",

  "labels": {

     "HAPROXY_GROUP":"external",

     "HAPROXY_0_VHOST":"nginx.marathon.mesos"

  },

  "cpus":0.2,

  "mem":20.0,

  "instances": 2,

  "healthChecks": [{ "path": "/" }],

  "container": {

    "type":"DOCKER",

    "docker": {

     "image": "docker.io/nginx",

     "network": "BRIDGE",

     "portMappings":[{"containerPort":80,"hostPort":0,"servicePort":80,"protocol":"tcp"}]

    }

  }

}

注意几点：

一定要加上HAPROXY_GROUP标签，它填写的是marathon-lb创建时定义的组名（如上）
HAPROXY_0_VHOST是标签名，对于web服务可以加上VHOST标签，让marathon-lb设置WEB虚拟主机；这个标签名字可以随便定义，目的是为了便于区别应用容器。一般可以用业务域名来描述标签。
"instances"表示应用的实例数，一般默认是1，如果写成n，说明创建n个应用。
containerPort为80,是指容器内的端口。
hostPort是当前主机映射到contenterPort的端口，如果hostPort为0的话,则说明是随机的。
serverPort是marathon-lb需要配置的haproxy代理暴露的端口,这里设置为80，说明访问marathon-lb机器的80端口就可为访问这个应用容器的80端口。

需要记住：
　　对于web服务，servicePort设置为0即可，marathon-lb会自动把web服务集群发布到80、443上；
　　所以上面docker_nginx_json文件里的"servicePort"后面的端口可以写成0，这样后端若是有443端口开启，marathon-lb会自动分发到上面。
　　最后把域名解析到marathon-lb所在的机器ip上，访问域名时就会自动发布到后端的容器应用上。

同样我们也可以在marathon管理控制界面创建nginx容器：

docker集群——Mesos集群下的负载均衡marathon-lb

应用容器创建好之后，如下，可以看到容器创建后的“Labels”标签信息，这个在应用容器繁多的情况下很有用，便于识别：

docker集群——Mesos集群下的负载均衡marathon-lb

还可以在创建一组绑定marathon-lb的nginx应用容器（只需要将docker_nginx.json文件里的id改变一下，比如改成“nginx2”，然后创建这个应用）

docker集群——Mesos集群下的负载均衡marathon-lb

为了试验效果，分别将下面绑定了marathon-lb的四个nginx容器的访问内容修改一下：

[root@slave-2 ~]# docker ps

CONTAINER ID        IMAGE               COMMAND                  CREATED             STATUS              PORTS                   NAMES

2d0117ff35d5        docker.io/nginx     "nginx -g 'daemon off"   5 minutes ago       Up 4 minutes        0.0.0.0:31112->80/tcp   mesos-7e126eca-5cc9-4dab-97a7-ee25132ae82e-S1.4899d7cc-0062-4502-afaf-3a435deefb6c

[root@slave-2 ~]# cat index.html

this is nginx - port:31112

[root@slave-2 ~]# docker cp index.html 2d0117ff35d5:/usr/share/nginx/html

其余的同理。

访问四个Nginx容器的页面：

docker集群——Mesos集群下的负载均衡marathon-lb

登录marathon-lb的容器里面，查看生成的haproxy.cfg文件：

[root@slave-3 ~]# docker ps

CONTAINER ID        IMAGE                              COMMAND                  CREATED             STATUS              PORTS               NAMES

1e7967120ce4        docker.io/mesosphere/marathon-lb   "tini -g -- /marathon"   7 seconds ago       Up 6 seconds                            mesos-7e126eca-5cc9-4dab-97a7-ee25132ae82e-S2.bd0b3c6d-ff9f-470e-b617-e3f4ecd49cbb

[root@slave-3 ~]# docker exec -it 1e7967120ce4 /bin/bash

root@slave-3:/marathon-lb# cat haproxy.cfg

......

......

frontend nginx_80

  bind *:80

  mode http

  use_backend nginx_80

frontend nginx2_80

  bind *:80

  mode http

  use_backend nginx2_80

backend nginx_80

  balance roundrobin

  mode http

  option forwardfor

  http-request set-header X-Forwarded-Port %[dst_port]

  http-request add-header X-Forwarded-Proto https if { ssl_fc }

  option  httpchk GET /

  timeout check 20s

  server 192_168_93_136_31399 192.168.93.136:31399 check inter 60s fall 4

  server 192_168_93_137_31112 192.168.93.137:31112 check inter 60s fall 4

backend nginx2_80

  balance roundrobin

  mode http

  option forwardfor

  http-request set-header X-Forwarded-Port %[dst_port]

  http-request add-header X-Forwarded-Proto https if { ssl_fc }

  option  httpchk GET /

  timeout check 20s

  server 192_168_93_136_31464 192.168.93.136:31464 check inter 60s fall 4

  server 192_168_93_136_31703 192.168.93.136:31703 check inter 60s fall 4

这时候我们访问marathon-lb容器所在机器的80端口，则请求就会负载到后端的nginx机器上，不断刷新就会负载到后端不同的页面上：

docker集群——Mesos集群下的负载均衡marathon-lb

可以在三个slave节点上做keepalived心跳测试，绑定一个VIP，三个节点做成一主两从，keepalived.conf里监控80端口的marathon-lb进程。当marathon-lb在哪个节点上，VIP就漂移到那个节点上，业务域名解析到VIP上，这样也就完成了一个高可用方案。

查看haproxy的监控页面：

docker集群——Mesos集群下的负载均衡marathon-lb

总结几点：

docker应用容器创建时的servicePort端口设置，这个关系到使用haproxy负载后，最终的访问端口。
可以创建不同的marathon-lb容器（可以定义不同的group），然后依据这些marathon-lb创建不同业务的应用容器，以实现负载均衡。
marathon-lb容器默认会在三个slave节点中的某一个节点上创建，当所在节点出现故障或重启marathon-lb容器时，才会漂移到其他节点上，这样即实现了高可用（相当于"一主两从"），将业务玉域名解析到marathon-lb所在的节点ip上。
如果之前创建的应用容器绑定了marathon-lb，后续这个应用容器删除了，那么要记得重启marathon-lb，否则LB访问会出现故障。因为haproxy.cfg文件里还保留这个已删的应用容器的负载配置，重启marathon-lb后，haproxy.cfg文件才会更新。
为了安全考虑，最好不要将Marathon暴漏到公网上，要不定时监控Docker运行情况。此外，Mesos和Marathon启动的时候最好加认证，具体操作是：Marathon启动的时候加上--http_credentials即可，然后Mesos启动时候加上--authenticate --credentials参数，让Mesos slave 连接到Master的时候加上认证。

秒客网

docker集群——Mesos集群下的负载均衡marathon-lb

marathon-lb介绍

配置Marathon-lb

相关文章