Zabbix监控系统详解:系统功能介绍

时间:2024-03-09 16:09:15

监控系统在运维自动化里的角色,可以用下面三点来概括:

1、监控数据收集及可视化

2、异常数据报警

3、和其他系统协同工作。

  使用zabbix时,一般需要在被监控的服务器上安装Zabbix Agent,Zabbix Server 会和Zabbix Agent进行过通信,获取监控数据,这是Zabbix监控的一般模式。

选择Zabbix的理由:

  1. 监控系统能够自定义监控的内容,可以自己写脚本来收集需要的数据
  2. 数据要保存在数据库中,这样在需要的时候可以对这些数据进行分析计算
  3. 能够方便、快速得将监控加入到服务器上,不需要繁琐的操作
  4. 数据可视化不要很花哨,但要好用
  5. 可以定义复杂啊的报警逻辑,做到Item之间的关联报警,而不是只能针对一个
  6. 报警需要被确认,让运维人员知道多少报警已经有人认领并开始处理了
  7. 报警方式要能够自定义,可以发邮件、发短信
  8. 报警内容要自己可设置,在报警右键中加入一些简单的分析人,而不是让运维人员上服务器敲命令来获取基本的信息
  9. 报警后可以自动跑一些命令。这些命令可以是获取运维人员需要的信息,也可以是自动修复,比如重启服务等。
  10. 有强大的API可以使用,可以让其他系统来调用完成工作。
  11. 监控数据是开放的,数据库中的数据结构发不要太复杂,让人无从下手
  12. 监控可视化的图可以方便的引用,而不是要用一大串JavaScript

Zabbix Server:Zabbix的控制中心,收集数据、写入数据库都是它的干工作。

Zabbix Agent:部署在被监控服务器上的一个进程,负责和Zabbix Server交互,执行命令。

Host:广义上的服务器,大多数情况指代的是刀片机这类,在少部分时间会知道包括交换机在呢诶的,被Zabbix 监控的实体。

Item:对于某一个指标的监控,对应的是Items,英文愿意是“物品”。比如某台服务器的CPU负载就是一个Item。

Trigger:一些逻辑规则的组合,它有三个值:正常、异常、未知、

Action:当Trigger符合某个值的时候,Zabbix会进行的操作,比如常见的发邮件。