利用zabbix监控RocketMQ

时间:2022-08-17 08:18:37

根据需求,监控三个指标:MQ进程、自定义监控项订阅组的未消费值Diff Total和TPS。

创建MQ 状态的监控模板,进程监控利用zabbix自带的模板;

监控订阅组的Diff Total和TPS

因为每个Nameserver的订阅组可能会实时改变,所以采用自动发现的方式获取所有的订阅组信息。再根据nameserver 和订阅组获取其Diff Total和TPS。

步骤:

编写订阅组自动发现和自定义监控项的脚本。

#!/bin/bash
GroupInfo=`sh /opt/rocketmq/incubator-rocketmq-rocketmq-all-4.1.0-incubating/distribution/target/apache-rocketmq/bin/mqadmin consumerProgress -n "ip:port;ip:port;ip:port" 2>/dev/null`
#echo "$GroupInfo"
GroupName=`echo "$GroupInfo"|grep -v "#Group"|awk '{print $1}'`
subgroup_discovery () {
COUNT=`echo "$GroupName" |wc -l`
INDEX=0
echo '{"data":['
echo "$GroupName" | while read LINE; do
echo -n '{"{#GROUPNAME}":"'$LINE'"}'
INDEX=`expr $INDEX + 1`
if [ $INDEX -lt $COUNT ]; then
echo ','
fi
done
echo ']}'
} diffandtps () {
GroupConsume=`echo "$GroupInfo"|grep -w $1`
#echo $GroupConsume
if [[ $2 == "TPS" ]]; then
echo $GroupConsume|awk '{print $(NF-1)}'
#echo "TPS"
elif [[ $2 == "diff" ]];then
echo $GroupConsume|awk '{print $NF}'
fi
} case "$1" in
subgroup_discovery)
subgroup_discovery
;;
diffandtps)
diffandtps $2 $3
;;
*)
echo "Usage:$0"
;;
esac

根据nameserver实时获取所有的订阅组信息。

命令为MQ自带的mqadmin:

sh mqadmin consumerProgress -n ip:port

利用zabbix监控RocketMQ

根据订阅组名称获取其Diff Total 和TPS。

修改配置文件,重启zabbix agent。在zabbix/conf/zabbix_agentd.conf中添加如下信息:

Timeout=30

UnsafeUserParameters=1

UserParameter=mq.subgroup.discovery,/opt/zabbix/mq_status.sh subgroup_discovery

UserParameter=mq.subgroup.diff[*],/opt/zabbix/mq_status.sh diffandtps $1 diff

UserParameter=mq.subgroup.tps[*],/opt/zabbix/mq_status.sh diffandtps $1 TPS

注意:mqadmin命令执行时有一定的时长,所以设置Timeout=30,否则会报错。

配置文件改好后重启agent生效。

在zabbix web端创建自动发现规则

配置文件的自动发现项名称为键值

利用zabbix监控RocketMQ

在zabbix web端的自动发现规则里面创建监控项原型

此处监控两个指标,需要两个监控项

利用zabbix监控RocketMQ

Diff Total监控:

因为可能存在复值,所以信息类型选择浮点数

利用zabbix监控RocketMQ

TPS监控:

利用zabbix监控RocketMQ

在检测中-最新数据-主机中查看是否出现预期的数据。

利用zabbix监控RocketMQ