根据需求,监控三个指标:MQ进程、自定义监控项订阅组的未消费值Diff Total和TPS。
创建MQ 状态的监控模板,进程监控利用zabbix自带的模板;
监控订阅组的Diff Total和TPS
因为每个Nameserver的订阅组可能会实时改变,所以采用自动发现的方式获取所有的订阅组信息。再根据nameserver 和订阅组获取其Diff Total和TPS。
步骤:
编写订阅组自动发现和自定义监控项的脚本。
#!/bin/bash
GroupInfo=`sh /opt/rocketmq/incubator-rocketmq-rocketmq-all-4.1.0-incubating/distribution/target/apache-rocketmq/bin/mqadmin consumerProgress -n "ip:port;ip:port;ip:port" 2>/dev/null`
#echo "$GroupInfo"
GroupName=`echo "$GroupInfo"|grep -v "#Group"|awk '{print $1}'`
subgroup_discovery () {
COUNT=`echo "$GroupName" |wc -l`
INDEX=0
echo '{"data":['
echo "$GroupName" | while read LINE; do
echo -n '{"{#GROUPNAME}":"'$LINE'"}'
INDEX=`expr $INDEX + 1`
if [ $INDEX -lt $COUNT ]; then
echo ','
fi
done
echo ']}'
} diffandtps () {
GroupConsume=`echo "$GroupInfo"|grep -w $1`
#echo $GroupConsume
if [[ $2 == "TPS" ]]; then
echo $GroupConsume|awk '{print $(NF-1)}'
#echo "TPS"
elif [[ $2 == "diff" ]];then
echo $GroupConsume|awk '{print $NF}'
fi
} case "$1" in
subgroup_discovery)
subgroup_discovery
;;
diffandtps)
diffandtps $2 $3
;;
*)
echo "Usage:$0"
;;
esac
根据nameserver实时获取所有的订阅组信息。
命令为MQ自带的mqadmin:
sh mqadmin consumerProgress -n ip:port
根据订阅组名称获取其Diff Total 和TPS。
修改配置文件,重启zabbix agent。在zabbix/conf/zabbix_agentd.conf中添加如下信息:
Timeout=30
UnsafeUserParameters=1
UserParameter=mq.subgroup.discovery,/opt/zabbix/mq_status.sh subgroup_discovery
UserParameter=mq.subgroup.diff[*],/opt/zabbix/mq_status.sh diffandtps $1 diff
UserParameter=mq.subgroup.tps[*],/opt/zabbix/mq_status.sh diffandtps $1 TPS
注意:mqadmin命令执行时有一定的时长,所以设置Timeout=30,否则会报错。
配置文件改好后重启agent生效。
在zabbix web端创建自动发现规则
配置文件的自动发现项名称为键值
在zabbix web端的自动发现规则里面创建监控项原型
此处监控两个指标,需要两个监控项
Diff Total监控:
因为可能存在复值,所以信息类型选择浮点数
TPS监控:
在检测中-最新数据-主机中查看是否出现预期的数据。