【CMDB和自动化运维】

时间:2022-09-02 16:28:06

一、IT运维的分类

  运维,是公司中一个必不可缺的职位,它的工作指的是对已经搭建好的网络,软件,硬件进行维护。运维领域也是细分的,有硬件运维(基础运维)和软件运维(应用运维)。

  • 硬件运维主要包括对基础设施的运维,比如机房的设备,主机的硬盘,内存这些物理设备的维护
  • 软件运维主要包括系统运维和应用运维,系统运维主要包括对OS,数据库,中间件的监控和维护,这些系统介于设备和应用之间,应用运维主要是对线上业务系统的运维

 二、传统运维的痛点

日常工作繁琐

  日常工作是比较繁琐的,研发同学会经常需要到服务器上查日志,重启应用,或者是说今天上线某个产品,需要部署下环境。这些琐事是传统运维的大部分工作。

应用运行环境不一

  再部署某应用后,应用不能访问,就会听到开发人员说,在我的环境运行很好的,怎么部署到测试环境后,就不能用了,因为各类环境的类库不统一
还有一种极端情况,运维人员习惯不同,可能凭自己的习惯来安装部署软件,每种服务器上运行软件的目录不统一。

 运维及部署效率低下

  部署项目或者应用时,运维人员需要登录服务器上执行命令,不仅仅效率很低,并且非常容易出现人为的错误,一旦出现人为的错误,追溯问题将会非常不容易。

无用报警信息过多

  使用传统的运维,运维人员会经常收到很多报警信息,多数信息是无用的,造成运维人员经常屏蔽报警信息,这样又有有其他问题。另外如果应用的访问速度出了问题,总是需要从系统、网络、数据库、等一步步的查找原因,效率很低。

资产管理和应用管理混乱

  资产管理,服务管理经常记录在excel、文本文件或者wiki中,不便于管理,老员工因为比较熟,不注重这些文档的维护,只有靠每次有新员工入职时,资产才能更正一次。

三、自动化运维平台的特性

自动化运维最重要的就是标准化一切

  • OS的选择统一化,同一个项目使用同样的OS系统部署其所需的各类软件。
  • 软件安装标准化,例如JAVA虚拟机,PHP,nginx,mysql等各类应用需要的软件版本,安装目录,数据存放目录,日志存放目录。
  • 应用包目录统一标准化,及应用命名标准化
  • 启动脚本统一目录和名字,需要变化的部分通过参数传递
  • 配置文件标准化,需要变化的部分通过参数传递
  • 日志输出,日志目录,日志名字标准化
  • 应用生成的数据要实现统一的目录存放
  • 主机/虚拟机命名标准化,虚拟机管理使用标准化模板
  • 使用docker比较容易实现软件运行环境的标准化

四、资产管理系统(CMDB)

CMDB系统是所有运维工具的数据基础

CMDB包含的功能

  1. 用户管理,记录测试,开发,运维人员的用户表
  2. 业务线管理,需要记录业务的详情
  3. 项目管理,指定此项目属于哪条业务线,以及项目详情
  4. 应用详情,指定此应用的开发人员,属于哪个项目,代码和地址,部署目录,部署集群,依赖的应用买软件等信息
  5. 主机管理,包括云主机,物理机,主机属于哪个集群,运行着哪些软件,主机管理员,连接哪些网络设备,云主机的资源池,存储等相关信息
  6. 主机变更管理,主机的一些信息变更,例如管理员,所属集群等信息更改,连接网络变更等
  7. 网络设备管理,主要纪录网络设备的详细信息,及网络设备连接的上级设备
  8. IP管理,IP属于哪个主机,哪个网段,是否被占用等

CMDB实现的四种方式

  •  Agent实现方式
Agent方式实现CMDB,在每台服务器上部署Agent脚本,将服务器上的Agent程序作为定时任务,定时将资产信息提交到指定API,进行
数据分析与清洗后录入数据库。

【CMDB和自动化运维】

其本质上就是在各个服务器上执行subprocess.getoutput()命令,然后将每台机器上的执行的结果,返回给主机API,然后主机
API接受到这些数据后,放入到数据库,最终通过web界面展现给用户。

优点:速度快

缺点:需要为每台服务器都部署一个Agent程序

应用场景:服务器较多的情况下推荐使用

  • ssh实现方式
中控机通过Paramiko模块登录到各个服务器上,然后以执行命令的方式去获取各个服务器上的信息。

【CMDB和自动化运维】

优点:无Agent程序

缺点:速度慢

应用场景:服务器较少的情况下推荐使用

【CMDB和自动化运维】【CMDB和自动化运维】
import paramiko

# 创建SSH对象
ssh = paramiko.SSHClient()
# 允许连接不在know_hosts文件中的主机

ssh.set_missing_host_key_policy(paramiko.AutoAddPolicy())
# 连接服务器
ssh.connect(hostname='c1.salt.com', port=22, username='root', password='123')
# 执行命令
stdin, stdout, stderr = ssh.exec_command('df')
# 获取命令结果
result = stdout.read()
# 关闭连接
ssh.close()
python代码
  • salt-stack方式实现

【CMDB和自动化运维】

此方案本质上和第二种方案大致是差不多的流程,中控机发送命令给服务器。服务器将结果放入另外一个队列中,中控机获取将服
务器信息发送至API主机而录入数据库。

优点:速度快,开发成本低

缺点:依赖于第三方工具

salt-stack的安装与配置

1.安装与配置

master端:
"""
1.安装salt-master
    yum install salt-master
2.修改配置文件:/etc/salt/master
    interface:0.0.0.0  #表示Master的Ip
3.启动
    server salt-master start 
"""
minion端:
"""
1.安装salt-minion
    yum install salt-minion
2.修改配置文件:/etc/salt/minion
    master:10.0.0.51 #master的ip地址
    或者(多个master,随机选择)
    master:
      - 10.0.0.51
      - 10.0.0.52
      random_master:True    
    id:c2.salt.com  #客户端在salt-master中显示的唯一ID
3.启动
    service salt-minion start
"""

2.授权

"""
salt-key -L     #查看以授权和未授权的slave
salt-key -a salve_id  #接受指定id的salve
salt-key -r salve_id  #拒绝指定id的salve
salt-key -d salve_id  #删除指定id的salve 
"""

3.执行命令

在Master服务器上对salve进行远程操作

salt 'c2.salt.com' cmd.run 'ifconfig'

基于API的方式

import salt.client
local = salt.client.LocalClient()
result = local.cmd('c2.salt.com','cmd.run',['ifconfig'])

参考安装:

http://www.cnblogs.com/tim1blog/p/9987313.html

https://www.jianshu.com/p/84de3e012753

  • Puppet(ruby语言开发)方式实现
每隔30分钟,通过RPC消息队列将执行的结果返回给用户