
在阿里云上部署了zabbix,一直能正常接收到zbx发来的报警邮件(报警邮箱是163的),不知是什么原因,突然无法接收到报警邮件了。
但在服务器上手动执行echo "hello"|mail -s "Test email" admin@xxxx.com,发现可以正常接收。手动测试报警脚本也能正常接收,真奇怪。
错误排查过程:
1.仔细检查了zabbix服务端的相关配置信息(动作、权限、报警媒介类型、报警脚本等),均无问题
2.重启了zabbix服务端程序,故障依旧存在。
3.查看/var/log/zabbix/zabbix_server.log服务端日志,没找到有价值的信息
4.在zabbix_server.conf中发现可以调整debug调试信息的级别,于是修改了级别,如下:
vim /etc/zabbix/zabbix_server.conf
DebugLevel= #由0改为4
保存退出,重启服务。
> /var/log/zabbix/zabbix_server.log #清空日志
然后作一些动作来触发报警(如添加一个普通用户,修改root密码等),
less /var/log/zabbix/zabbix_server.log #观察日志的变化,发现有如下错误信息:
搜索下8015错误信息后,对/etc/mail.rc文件作了修改:
vim /etc/mail.rc
将原来的set nss-config-dir=/root/.certs注释掉,改成了:
set nss-config-dir=/etc/pki/nssdb
保存退出。又可以收到报警邮件了。
vim /etc/zabbix/zabbix_server.conf
DebugLevel=0
保存退出。重启zabbix。