Linux数据中心服务器一般很少被黑。但也有出故障的时候,没有十全十美的,当服务器连接到网络时,你永远不知道什么时候会出现问题,会出现什么样问题。当不可避免出现了错误的时,您应该知道如何解决问题,以及所需的所有工具。
对于大多数服务(Apache,MySQL等),有单独的日志可以将您键入连接,身份验证,安全性和许多其他问题。但是,当您需要研究的系统是服务器平台本身时会发生什么?当存在硬件问题时,您检查哪个日志文件?
我想到的第一个是一个特殊命令,它提供了有关在引导期间加载的各种设备驱动程序的大量信息。通过此命令显示的信息可以帮助您了解Linux系统正在发生的事情。命令就是dmesg。我一直在使用此工具对Linux服务器和台式机进行故障排除。下面让我们看看它是如何工作的。
一、说明:dmesg是每个Linux发行版上的命令之一,您只需打开一个终端窗口并开始使用该工具。
二、用法:如果直接使用dmesg命令,出来的信息量太大,这里有一个方法减少dmesg的输出,命令如下所示:
dmesg | less
以这种方式运行dmesg命令得到如下图:
然而,即使使用dmesg这种命令效果也不佳,仍有大量的信息可供筛选。dmesg有一些选项可以让你缩减这些信息。您可以将输出限制为仅错误和警告,这样您就不必筛选系统中正常运行的所有内容。如何做?使用-level标签。可以查看八个不同的级别,每个级别可以组合以进行dmesg输出的特定迭代。以下是八级别:
emerg - 系统无法使用
alert - 必须立即采取行动
crit - 危急的条件
err - 错误条件
warn - 警告条件
notice - 正常但重要的条件
info - 信息
debug - 调试级消息
假设您只想查看警报和严重警告。对此的命令是:
dmesg --level=alert,crit
希望在运行上述命令后,您将看不到输出。如果你什么也看不见,而且你知道存在问题,那么将等级降低到一定程度,比如错误和警告:
dmesg --level=err,warn
现在我们来看看有用的信息(如下图)。
故障时间戳
如果您想准确了解错误或警告发生的时间,该怎么办?您可以添加-T选项,如下所示:
dmesg --level=err,warn -T
现在我们有一个与每个条目相关的时间戳(如下图)。
如果您发现信息仍然太多,请将上述命令传递给less。如果您没有时间马上分析完成,可以将其导出,如下所示:
dmesg --level = err,warn -T> dmesg_output
dmesg命令在数据中心管理工具包中使用方便。借助这款易于使用的工具,您可以开始大规模地对服务器进行故障排除,然后开始缩小搜索范围。