基于zookeeper+mesos+marathon的docker集群管理平台

时间:2022-12-26 16:20:21

参考文档:

  1. mesos:http://mesos.apache.org/
  2. mesosphere社区版:https://github.com/mesosphere/open-docs
  3. mesosphere仓库:https://github.com/mesosphere/open-docs/blob/master/downloads/mesos.md
  4. docker-ce安装:https://docs.docker.com/engine/installation/linux/docker-ce/centos/
  5. 原理&安装参考1:http://www.cnblogs.com/kevingrace/p/5685313.html
  6. 原理&安装参考2:http://www.xuliangwei.com/xubusi/422.html

本文主要涉及基于zookeeper+mesos+marathon的docker集群管理平台的配置操作,原理可见上面参考文档。

一.环境

1. 拓扑

基于zookeeper+mesos+marathon的docker集群管理平台

2. 拓扑说明

主机名

IP

OS

安装服务

master-node1

10.11.4.156

CentOS-7-x86_64-1511

zookeeper, mesos-master, marathon

master-node2

10.11.4.157

CentOS-7-x86_64-1511

zookeeper, mesos-master, marathon

master-node3

10.11.4.158

CentOS-7-x86_64-1511

zookeeper, mesos-master, marathon

slave-node1

10.11.4.146

CentOS-7-x86_64-1511

mesos-slave, docker

slave-node2

10.11.4.147

CentOS-7-x86_64-1511

mesos-slave, docker

slave-node3

10.11.4.148

CentOS-7-x86_64-1511

mesos-slave, docker

3. 软件版本

服务

版本

作用

zookeeper

3.4.10

保持各master之间的通信,选举leader

mesos-master

1.3.0

管理接入mesos的各个framework & slave,并将slave上的资源按照相应策略分配给framework

mesos-slave

1.3.0

任务执行节点

marathon

1.4.7

调度器,用于下发任务,可保持长应用

docker

17.06.1.ce

具体执行docker下发任务

二.环境Master节点

以master-node1为例,master-node2/node3配置根据环境微调。

1. zookeeper安装

请参考:http://www.cnblogs.com/netonline/p/7695034.html

ps:zookeeper需要java支持,这里安装的是jdk-8u131-linux-x64。

2. mesos-master&marathon安装配置

1)安装mesos-master&marathon

# 添加mesosphere repository,根据github mesosphere社区版获取最新repository
[root@master-node1 ~]# cd /usr/local/src/
[root@master-node1 src]# wget http://repos.mesosphere.io/el/7/noarch/RPMS/mesosphere-el-repo-7-3.noarch.rpm
[root@master-node1 src]# rpm -ivh mesosphere-el-repo-7-3.noarch.rpm
[root@master-node1 src]# yum install mesos marathon -y

2)mesos-master&marathon关联zookeeper

[root@master-node1 src]# cd ~

#mesos-master选主
#完全替换默认配置
[root@master-node1 ~]# vim /etc/mesos/zk
zk://10.11.4.156:2181,10.11.4.157:2181,10.11.4.158:2181/mesos #marathon选主
#默认marathon无相关配置目录/文件
[root@master-node1 ~]# mkdir -p /etc/marathon/conf/
[root@master-node1 ~]# vim /etc/marathon/conf/zk
zk://10.11.4.156:2181,10.11.4.157:2181,10.11.4.158:2181/marathon 

3)marathon连接mesos-master

#默认marathon无相关配置master文件
[root@master-node1 ~]# vim /etc/marathon/conf/master
zk://10.11.4.156:2181,10.11.4.157:2181,10.11.4.158:2181/mesos 

4)mesos-master配置quorum&work_dir

#quorum设置为整数,且大于master节点数的1/2
[root@master-node1 ~]# echo "2" > /etc/mesos-master/quorum #work_dir也在/etc/mesos-master/目录下,保持默认值即可
[root@master-node1 ~]# cat /etc/mesos-master/work_dir
/var/lib/mesos 

5)mesos-master&marathon配置ip&hostname

#hostname直接配置的本机ip,是为了防止出现dns无法解析的问题;
#其余两个节点也配置本机地址即可
[root@master-node1 ~]# echo "10.11.4.156" > /etc/mesos-master/ip
[root@master-node1 ~]# echo "10.11.4.156" > /etc/mesos-master/hostname #marathon配置hostname;
#其余两个节点也配置本机地址即可
[root@master-node1 ~]# echo "10.11.4.156" > /etc/marathon/conf/hostname #修改hosts
[root@master-node1 ~]# echo "10.11.4.156 master-node1" >> /etc/hosts

6)开机启动

[root@master-node1 ~]# systemctl enable mesos-master marathon
[root@master-node1 ~]# systemctl disable mesos-slave
[root@master-node1 ~]# systemctl start mesos-master marathon

3. 设置iptables

# tcp2181,2888,3888与zookeeper相关;
# tcp5050是mesos-master的访问端口;tcp5051是mesos-slave的访问端口;
# tcp8080是marathon的访问端口。
[root@master-node1 ~]# vim /etc/sysconfig/iptables
-A INPUT -p tcp -m state --state NEW -m tcp --dport 2181 -j ACCEPT
-A INPUT -p tcp -m state --state NEW -m tcp --dport 2888 -j ACCEPT
-A INPUT -p tcp -m state --state NEW -m tcp --dport 3888 -j ACCEPT
-A INPUT -p tcp -m state --state NEW -m tcp --dport 5050 -j ACCEPT
#-A INPUT -p tcp -m state --state NEW -m tcp --dport 5051 -j ACCEPT
-A INPUT -p tcp -m state --state NEW -m tcp --dport 8080 -j ACCEPT [root@master-node1 ~]# service iptables restart

三.Slave节点

以slave-node1为例,slave-node2/node3配置根据环境微调。

1. docker安装配置

[root@slave-node1 ~]# yum remove docker docker-common docker-selinux docker-engine

#镜像驱动使用device-mapper
[root@slave-node1 ~]# yum install -y yum-utils device-mapper-persistent-data lvm2 #添加repository
[root@slave-node1 ~]# yum-config-manager --add-repo https://download.docker.com/linux/centos/docker-ce.repo
[root@slave-node1 ~]# yum makecache fast [root@slave-node1 ~]# yum install docker-ce -y #配置mirror
[root@slave-node1 ~]# curl -sSL https://get.daocloud.io/daotools/set_mirror.sh | sh -s http://xxxxxxxx.m.daocloud.io #安装brctl,方便查看bridge
[root@slave-node1 ~]# yum install bridge-utils-1.5-9.el7.x86_64 -y #开机启动
[root@slave-node1 ~]# systemctl enable docker
[root@slave-node1 ~]# systemctl start docker

2. mesos-slave安装配置

1)安装mesos-slave

[root@slave-node1 ~]# cd /usr/local/src/
[root@slave-node1 src]# wget http://repos.mesosphere.io/el/7/noarch/RPMS/mesosphere-el-repo-7-3.noarch.rpm
[root@slave-node1 src]# rpm -ivh mesosphere-el-repo-7-3.noarch.rpm
[root@slave-node1 src]# yum install mesos -y

2)mesos-slave关联zookeeper

[root@slave-node1 src]# cd ~

#完全替换默认配置
[root@slave-node1 ~]# vim /etc/mesos/zk
zk://10.11.4.156:2181,10.11.4.157:2181,10.11.4.158:2181/mesos

3)配置marathon调用mesos运行docker

[root@slave-node1 src]# cd ~
[root@slave-node1 ~]# echo "docker,mesos" > /etc/mesos-slave/containerizers

4)mesos-slave配置ip&hostname

#其余两个节点也配置本机地址即可
[root@slave-node1 ~]# echo "10.11.4.146" > /etc/mesos-slave/ip
[root@slave-node1 ~]# echo "10.11.4.146" > /etc/mesos-slave/hostname #修改hosts
[root@master-node1 ~]# echo "10.11.4.146 slave-node1" >> /etc/hosts

5)开机启动

[root@slave-node1 ~]# systemctl enable mesos-slave
[root@slave-node1 ~]# systemctl disable mesos-master
[root@slave-node1 ~]# systemctl start mesos-slave

3. 设置iptables

# tcp5051是mesos-slave的访问端口。
[root@slave-node1 ~]# vim /etc/sysconfig/iptables
-A INPUT -p tcp -m state --state NEW -m tcp --dport 5051 -j ACCEPT [root@slave-node1 ~]# service iptables restart # iptabes重启后重新加载配置文件中的配置,默认配置中没有docker0网桥的nat表规则;
#重启docker将相关规则加载到iptables中,再保存规则到配置文件中;
#如果iptables中没有docker0网桥的nat表规则,在创建带有端口映射的容器时,会报错:"ExitCode": 128,iptables相关规则不能创建
[root@slave-node1 ~]# systemctl restart docker
[root@slave-node1 ~]# service iptables save

四.验证

1. mesos

登陆mesos web:http://10.11.4.156:5050

#登陆10.11.4.157/158都可以,通过zookeeper选主,登陆任一地址都会跳转到leader页面。

1)mesos-homepage

  • (1). 从首页可以看到mesos-master的leader是:10.11.4.157;
  • (2). mesos-agent:activated状态的agent有3个;
  • (3). mesos-master管理的3个agent的资源已汇总。

基于zookeeper+mesos+marathon的docker集群管理平台

2)mesos-Frameworks

  • (1). 在mesos框架中,marathon框架已经被识别,marathon的leader是:10.11.4.157;
  • (2). 虽然mesos-master与marathon的leader相同,但两者的leader是zookeeper独立选举的,并没有直接关系,是可以不同的。

基于zookeeper+mesos+marathon的docker集群管理平台

3)mesos-Agents

  • (1). 在Agnets中能看到3个agent;
  • (2). 同时能看到每个agent的资源;

基于zookeeper+mesos+marathon的docker集群管理平台

  • (3). 点击任一agent id,能看到更详细的agent信息。

基于zookeeper+mesos+marathon的docker集群管理平台

4)mesos state

浏览器访问:http://10.11.4.158:5050/master/state

2. marathon

登陆marathon web:http://10.11.4.156:8080

#或者点击mesos-frameworks页面中,已经选举出的marathon leader;

#登陆10.11.4.157/158都可以,通过zookeeper选主,登陆任一地址都会跳转到leader页面。

1)marathon-homepage

  • (1). 在首页中点击右上角问号,选择"About";

基于zookeeper+mesos+marathon的docker集群管理平台

  • (2). marathon-leader:10.11.4.157:8080;
  • (3). marathon连接到mesos leader:10.11.4.157:5050。

基于zookeeper+mesos+marathon的docker集群管理平台

3. marathon下发应用

1)API方式

#marathon是有api接口的,通过api的方式可调用marathon执行相关应用调度的请求
#在marathon服务所在节点创建json文件;
#以下json文件中的注释需去掉。
[root@master-node1 ~]# vim nginx.json
{
"id":"nginx1", #容器名,只在marathon生效
"cpus":0.2, #cpu用量
"mem":20.0, #mem用量
"instances": 1, #容器数量
"constraints": [["hostname", "UNIQUE",""]], #限制
"container": {
"type":"DOCKER", #应用类型
"docker": { #docker具体配置
"image": "nginx", #采用的image
"network": "BRIDGE", #网络模式
"portMappings": [
{"containerPort": 80, "hostPort": 0,"servicePort": 0, "protocol": "tcp" }
] #端口映射,”0”表示任意端口,"servicePort"服务端口
}
}
} #调用json文件
[root@master-node1 ~]# curl -X POST http://10.11.4.156:8080/v2/apps -d @/root/nginx.json -H "Content-type: application/json" 
  • (1). 登陆marathon,查看应用已下发成功,处于"Running"状态;容器的资源配置遵从json文件中的设置;针对应用,点击最右侧的"…"按钮,可进行相关操作;

基于zookeeper+mesos+marathon的docker集群管理平台

  • (2). 点击应用名或状态,查看应用具体信息,可查到此应用下发到slave节点:10.11.4.147,且映射主机的31896端口;同时可查看"stderr"与"stdout"日志等(也可到mesos任务的"Sandbox"中查看下载);

基于zookeeper+mesos+marathon的docker集群管理平台

  • (3). Configuration标签下,列出了生成的容器的相关配置,除json文件预设置的参数外,还有json文件中定义的"任意值"也有了明确的配置;同时可以"Edit";

基于zookeeper+mesos+marathon的docker集群管理平台

  • (4). 在slave节点:10.11.4.147下查看容器;
    [root@slave-node2 ~]# docker ps

基于zookeeper+mesos+marathon的docker集群管理平台

基于zookeeper+mesos+marathon的docker集群管理平台

  • (6). 登陆mesos,"Active Tasks"有处于运行状态的任务。

基于zookeeper+mesos+marathon的docker集群管理平台

2)通过marathon web页面手工创建

  • (1). 点击marathon首页右上角的"Create Application",选择"JSON Mode",粘帖相关json配置,实质上这也是在调用marathon的api接口,只是入口变为web页面;

基于zookeeper+mesos+marathon的docker集群管理平台

  • (2). 取消"JSON Mode",可以看到粘帖的json配置已经被记录下来;也可以直接在非"JSON Mode"填写相关配置。

基于zookeeper+mesos+marathon的docker集群管理平台

基于zookeeper+mesos+marathon的docker集群管理平台

基于zookeeper+mesos+marathon的docker集群管理平台

基于zookeeper+mesos+marathon的docker集群管理平台的更多相关文章

  1. Docker集群管理(一)—— 基础docker+swarm+shipyard

    目的 学习docker的集群管理,摸索出高可用的docker微服务架构方案.本篇文章只初步的了解下swarm(docker新版已集成了swarm)的使用,了解docker的发现服务的基础方法(dock ...

  2. docker集群管理

    docker集群管理 ps:docker machine     docker swarm       docker compose  在Docker Machine发布之前,你可能会遇到以下问题: ...

  3. docker集群管理之kubernetes

    一.简介 kubernetes又叫做k8s,是Google开发的一款开源的docker集群管理工具,在这里对它的“发家史”,我不做过多的阐述,有时间大家可以自己去百度一下: 下面我要讲的就是容易混淆的 ...

  4. 基于 Clusternet 与 OCM 打造新一代开放的多集群管理平台

    背景 随着 5G.物联网设备的爆炸性增长以及智能终端不断增强的计算能力,带来了前所未有的数据量,传统的中心集中式计算捉襟见肘."新基建"战略的实施,工业互联网.车联网/自动驾驶.智 ...

  5. OpenPAI:大规模人工智能集群管理平台介绍及任务提交指南

    产品渊源: 随着人工智能技术的快速发展,各种深度学习框架层出不穷,为了提高效率,更好地让人工智能快速落地,很多企业都很关注深度学习训练的平台化问题.例如,如何提升GPU等硬件资源的利用率?如何节省硬件 ...

  6. centos7上基于kubernetes的docker集群管理

    kubernetes和docker的作用这里就不作介绍了,直接进入主题. 本文的目的是搭建docker集群,并使用kubernetes管理它们. 文中的软件环境除了kubernetes和docker, ...

  7. Docker集群管理工具 - Kubernetes 部署记录 (运维小结)

    一.  Kubernetes 介绍 Kubernetes是一个全新的基于容器技术的分布式架构领先方案, 它是Google在2014年6月开源的一个容器集群管理系统,使用Go语言开发,Kubernete ...

  8. Centos下安装Docker集群管理工具Shipyard

    一. Docker Shipyard是什么 ? shipyard是一个开源的docker管理平台,其特性主要包括: 支持镜像管理.容器管理. 支持控制台命令 容器资源消耗监控 支持集群swarm,可以 ...

  9. Docker集群管理(三)—— docker swarm mode基础教程

    docker从1.12版(及后续版本)集成了swarmkit.可以方便的实现docker集群.它有哪些特点呢: 集成了集群功能 分散设计:manager和worker两种节点. 声明式服务模式 可伸缩 ...

随机推荐

  1. clojure 之 hello world

    1. 安装Leiningen 2. lein new app bar 3. lein run Hello, World!

  2. NOIP2003 神经网络

    题目背景 人工神经网络(Artificial Neural Network)是一种新兴的具有自我学习能力的计算系统,在模式识别.函数逼近及贷款风险评估等诸多领域有广泛的应用.对神经网络的研究一直是当今 ...

  3. AngularJS 中的 Promise 和 设计模式(转)

    原文地址:http://my.oschina.net/ilivebox/blog/293771 目录[-] Promise 简单例子 链式 Promise Parallel Promises And ...

  4. 一些qml资料

    qml开发ios应用 http://www.seanyxie.com/qt-qml%E7%A7%BB%E5%8A%A8%E5%BC%80%E5%8F%91%E4%B9%8B%E5%9C%A8ios%E ...

  5. js控制TR的显示隐藏

    在很多现实的场景中,有的文本框我们希望在选择“是”的按钮之后才出现,这就需要js控制TR的隐藏和显示,如何控制,本文为大家揭晓 下文分享的一段代码:选择是的按钮就显示身高和体重的文本框的代码.注意:r ...

  6. C# 与 C++ 数据类型对照

    C++            C#=====================================WORD            ushortDWORD            uintUCH ...

  7. 【转】Java 内部类种类及使用解析

    Java 内部类种类及使用解析 内部类Inner Class 将相关的类组织在一起,从而降低了命名空间的混乱. 一个内部类可以定义在另一个类里,可以定义在函数里,甚至可以作为一个表达式的一部分. Ja ...

  8. 虚拟机创建流程中neutron代码分析(一)

    前言: 在openstack的学习当中有一说法就是网络占学习时间的百分之七十.这个说法或许有夸大的成分,但不可否认的是openstack中的 网络是及其重要的部分,并且难度也是相当大.试图通过nova ...

  9. Error : Invalid Allocation Size :·····Bytes 以及 abort() has been called

    把这两个Error放在一起,主要是因为在写代码的时候发现,他们有公共的错误. (一)Invalid Allocation Size 主要是因为new分配内存出了问题,从直观翻译来看,应该是内存分配长度 ...

  10. word20170105订酒店 hotel reservation有用的词和句子

    有用的词: hotel reservation/booking: 酒店预订 standard room:标准间 suite: 套房 king size bed: 大床房 double bed:双床房 ...