rsyslog服务日志报错分析1

时间:2020-12-18 17:28:02

 

客户问题:

最近对服务器进行日志检查时,发现部分主机的rsyslog服务状态有报错,报错详情如下

 rsyslog服务日志报错分析1

 

排查过程:

 

1.从报错截图来看,报错主要发生在文件'/usr/lib64/rsyslog/omazuremds.so'上

 

2.经查询该文件模块是由LinuxDiagnostic 2.3的虚拟机扩张进行安装的,该扩展的安装位置见下

rsyslog服务日志报错分析1

 

3.目前怀疑问题机器的LinuxDiagnostic 2.3扩展没有在机器上正确安装,或在虚拟机内部没能正常启动引起的报错

 

4.可以通过如下方法检查该扩展的正确性

 

a.在Portal查看该扩展是否安装成功

 rsyslog服务日志报错分析1

 

b.登陆虚拟机查看如下文件是否存在,权限是否正确

[root@hlmcen75n1-t1 ~]# ll /usr/lib64/rsyslog/omazuremds.so -rwxr--r--. 1 root root 31536 Jun  3 09:13 /usr/lib64/rsyslog/omazuremds.so

[root@hlmcen75n1-t1 ~]# ll /var/lib/waagent/Microsoft.OSTCExtensions.LinuxDiagnostic-2.3.9021

total 31212

drwxr-xr-x. 2 root root       46 Jun  3 09:13 bin

-rwxr--r--. 1 root root     4121 Jun  3 09:13 ChangeLogs

drwx------. 2 root root       65 Jun  3 09:13 config

-rw-r--r--. 1 root root      554 Jun  3 09:13 daemon.log

-rwxr--r--. 1 root root    56743 Jun  3 09:13 diagnostic.py

-rw-r--r--. 1 root root      462 Jun  3 09:13 HandlerEnvironment.json

-rwxr--r--. 1 root root      420 Jun  3 09:13 HandlerManifest.json

-rw-r--r--. 1 root root     1382 Jun  3 09:13 lad_mdsd.mod

-rw-r--r--. 1 root root     1398 Jun  3 09:13 lad_mdsd.pp

-rwxr--r--. 1 root root      587 Jun  3 09:13 lad_mdsd.te

-rwxr--r--. 1 root root     1134 Jun  3 09:13 license.txt

-rwxr--r--. 1 root root      544 Jun  3 09:13 Makefile

-rwxr--r--. 1 root root      954 Jun  3 09:13 manifest.xml

-rwxr--r--. 1 root root     1505 Jun  3 09:13 mdsdConfig.xml.template

-rw-r--r--. 1 root root        0 Jun  3 09:13 mdsd.log

-rw-r--r--. 1 root root       10 Jun  3 09:13 mdsd.pid

-rw-r--r--. 1 root root        1 Jun  3 09:13 mrseq

-rw-r--r--. 1 root root        0 Jun  3 09:13 omfileconfig

-rwxr--r--. 1 root root     7021 Jun  3 09:13 portal.xml.template

-rwxr--r--. 1 root root    11828 Jun  3 09:13 README.md

drwxr-xr-x. 2 root root       55 Jun  3 09:13 rsyslog5

drwxr-xr-x. 2 root root       55 Jun  3 09:13 rsyslog7

drwxr-xr-x. 2 root root       55 Jun  3 09:13 rsyslog8

-rwxr--r--. 1 root root       44 Jun  3 09:13 run_unittests.sh

-rwxr--r--. 1 root root 31796822 Jun  3 09:13 scx-1.6.2-337.universal.x64.sh

drwxr-xr-x. 2 root root       30 Jun  3 09:13 services

drwx------. 2 root root       22 Jun  3 09:13 status

drwxr-xr-x. 2 root root       48 Jun  3 09:13 tests

drwxr-xr-x. 2 root root     4096 Jun  3 09:13 Utils

-rwxr--r--. 1 root root     3195 Jun  3 09:13 watcherutil.py

-rw-r--r--. 1 root root     2275 Jun  3 09:13 watcherutil.pyc

-rw-r--r--. 1 root root    12036 Jun  3 09:13 xmlCfg.xml

[root@hlmcen75n1-t1 ~]# ps aux | grep -i xml

root       7366  0.3  0.8 1438776 30252 ?       Sl   09:13   0:06 /var/lib/waagent/Microsoft.OSTCExtensions.LinuxDiagnostic-2.3.9021/bin/mdsd -A -C -c /var/lib/waagent/Microsoft.OSTCExtensions.LinuxDiagnostic-2.3.9021/./xmlCfg.xml -p 29131 -R -r lad_mdsd -e /var/log/azure/Microsoft.OSTCExtensions.LinuxDiagnostic/2.3.9021/mdsd.err -w /var/log/azure/Microsoft.OSTCExtensions.LinuxDiagnostic/2.3.9021/mdsd.warn -o /var/log/azure/Microsoft.OSTCExtensions.LinuxDiagnostic/2.3.9021/mdsd.info

 

5.如果上述扩展没有正常启动,可以通过如下方法解决该问题

 

a.在Azure Portal卸载LinuxDiagnostic的扩展

 rsyslog服务日志报错分析1

 

b.对虚拟机重新启用诊断设置

 rsyslog服务日志报错分析1