zabbix监控nginx的大概流程为:
1:被监控端的nginx开启stub_status模块
2:通过脚本的方式获取nginx的状态值
3:修改被监控端的配置文件,Userparameter=item.key[*],command
4:创建模版 添加应用集、监控项、触发器、图像等
5:添加主机,添加nginx模版,创建动作
6:测试
一、nginx的stub_stauts模块
stub_status模块主要用于查看nginx的一些状态信息
http://nginx.org/en/docs/http/ngx_http_stub_status_module.html 官网关于stub_status模块
1)若在机器上,还未安装nginx,那么在编译安装的时候,要加上stub_status模块参数
./configure --prefix=/usr/local/nginx --user=nginx --group=nginx --with-http_gzip_static_module --with-http_stub_status_module --with-http_ssl_module --with-pcre=/usr/local/lnmp/pcre-7.9
2)若机器上已经安装了nginx,查看是否安装的时候,是否安装了--with-http_stub_status_module
[root@lile Downloads]#/usr/local/nginx/sbin/nginx -V
nginx version: nginx/1.8.
built by gcc 4.4.(RedHat4.4.7-)(GCC)
built with OpenSSL1..1e-fips 11Feb2013
TLS SNI support enabled
configure arguments:--prefix=/usr/local/nginx --user=nginx --group=nginx --with-http_gzip_static_module --with-http_ssl_module --with-pcre=/usr/local/lnmp/pcre-7.9
若没有,那么进到安装目录执行(这里需要加的参数都要加上,而不是只加stub_status的)
./configure --prefix=/usr/local/nginx --user=nginx --group=nginx --with-http_gzip_static_module --with-http_stub_status_module --with-http_ssl_module --with-pcre=/usr/local/lnmp/pcre-7.9
然后make,不要make install
make
然后把新编译的nginx替换到旧的(这里可以先把原来的nginx执行脚本备份一下)
cp /home/lile/nginx-1.8./objs/nginx /usr/local/nginx/sbin/nginx
这个时候再使用/usr/local/nginx/sbin/nginx -V 查看的时候,configure arguments这里就有stub_status的模块参数了
3)修改nginx的配置文件,在server里加上:
location /ngx_status {
stub_status on;
access_log off;
allow 127.0.0.1;
allow 10.0.0.146;
}
4)启动nginx
5)浏览器访问:http://10.0.0.13/ngx_status ,返回这样一个数据
我的理解的意思:(通过做实验,理解出来的)
Active connections:当前活跃的客户端连接数,比如打开了3个浏览器窗口
accepts:接受客户端访问的总次数
handled:处理的连接总次数
requests:客户端请求的总次数
reading:nginx正在读取请求头的连接数
writing:nginx正将请求返回给客户端的连接数
waiting:当前等待客户端请求的空闲连接数
官网的解释:
二、写脚本,分别获取上面的值
nginx.sh 把这个脚本放在被监控端的服务器,然后在配置文件里指定位置
#!/bin/bash
Host=10.0.0.13
Port=80 ping(){
/bin/pidof nginx |wc -l
}
active(){
curl $Host:$Port/ngx_status >/dev/null |grep 'Active'|awk -F":"'{print $NF}'
}
Reading(){
curl $Host:$Port/ngx_status >/dev/null |grep 'Reading'|awk '{print $2}'
}
Writing(){
curl $Host:$Port/ngx_status >/dev/null |grep 'Writing'|awk '{print $4}'
}
Waiting(){
curl $Host:$Port/ngx_status >/dev/null |grep 'Waiting'|awk '{print $6}'
}
accepts(){
curl $Host:$Port/ngx_status >/dev/null |awk NR==|awk -F" "'{print $1}'
}
handled(){
curl $Host:$Port/ngx_status >/dev/null |awk NR==|awk -F" "'{print $2}'
}
requests(){
curl $Host:$Port/ngx_status >/dev/null |awk NR==|awk -F" "'{print $3}'
}
$
vim 除了:wq!保存退出 ZZ 也可以保存退出
三、修改被监控端的zabbix-agent的配置文件:
添加UserParameter值 vim zabbix-agent/etc/zabbix_agentd.conf
LogFile=/tmp/zabbix_agentd.log
Server=10.0.0.146
ServerActive=10.0.0.146
Hostname=Zabbix agent1
UserParameter=nginx.status[*],/home/lile/zabbix-agent/nginx.sh $
UserParameter:用户自定义key
格式:UserParameter=key[],command
key:[*] key里可以传递多个参数,item-key
command:key里传递的参数分别对应$1,$2......
四、测试
在zabbix服务端,使用zabbix-get命令进行检测:
使用方法:
[root@lile alertscripts]#/usr/local/zabbix-3.2./bin/zabbix_get
usage:
zabbix_get -s host-name-or-IP [-p port-number][-I IP-address]-k item-key
zabbix_get -h
zabbix_get -V
在服务端先使用zabbix-get检测看是否能得到值:只有这样能到到返回值,才能在zabbix界面显示出来
[root@lile alertscripts]#/usr/local/zabbix-3.2./bin/zabbix_get -s 10.0.0.13-k 'nginx.status[accepts]'
五:创建nginx模版
1:创建模版
2:在刚刚的nginx模版上创建应用集
3:创建监控项,把所有的需要监控的创建监控项,键值就是我们在配置文件里写的item-key,我的是nginx.status[*],把所有的全部创建起来 active Reading Writing Waiting accepts handled requests
4:创建触发器,我这里只是对nginx进程不存在的进行触发,这里的表达式根据脚本里写的ping函数,他的返回值来进行修改
5:创建图形
对刚刚nginx进程存不存在创建图像
其他状态信息创建一个图形
六、使用这个nginx模版
和原来的一样,进行测试
1:添加主机
2:在这个主机上添加nginx模版
3:添加动作
4:分别在被监控的主机上停止和启动nginx,进行测试,看是否会报警
这是恢复的报警