Unix操作系统监控详解(一)

时间:2022-06-01 16:59:15

一、描述

监控在检查系统问题运行状况以及优化系统性能工作上是一个不可缺少的部分。通过操作系统监控工具监视操作系统资源的使用情况,间接地反映了各服务器程序的运行情况。根据运行结果分析可以帮助我们快速定位系统问题范围或者性能瓶颈点。因此操作系统的监控是不容忽视的。

目前,比较流行的免费的监控工具有NMON和OWS软件。NMON工具是 IBM 提供的免费的在AIX与各种Linux操作系统上广泛使用的监控与分析工具。OWS(OSWatcher)是Oracle提供的一个用于操作系统监控的工具包,分Windows 和Linux 两个版本,但OSWBB软件包现支持的系统版本有:(1)AIX (2)Tru64  (3)Solaris (4)HP-UX  (5)Linux

1.1 nmon介绍

nmon是一种在AIX与各种Linux操作系统上广泛使用的监控与与分析工具,相对于系统资源上的一些监控工具来说,nmon所记录的信息是比较全面的,它能在系统运行过程中实时地捕捉系统资源的使用情况,并且能输出结果到文件中,然后通过nmon_analyzer工具产生数据文件与图形化结果。

NMON软件可监控的信息有:

  (1)CPU占用率

  (2)内存使用情况

  (3)磁盘I/O速度、传输和读写比率

  (4)文件系统的使用率

  (5)磁盘适配器

  (6)网络I/O速度、传输和读写比率、错误统计率与传输包的大小

  (7)消耗资源最多的进程

  (8)计算机详细信息和资源

  (9)页面空间和页面I/O速度

  (10)用户自定义的磁盘组

  (11)网络文件系统(NFS)

  (12)异步I/O,仅适用于AIX

  (13)工作负载管理器 (WLM),仅适用于 AIX

  (14)动态 LPAR (DLPAR) 更改,仅适用于面向 AIX 或 Linux 的 pSeries p5 和 OpenPower。

1.2 相关软件下载

  1)IBM的官网

  2)相关论坛:

http://www.webspherechina.net

  3)下载地址以及相关资料:

  http://www.webspherechina.net/club/viewthread.php?tid=7650

1.3 安装配置

1.3.1 解压软件包

Linux系统操作:

tar –zxvf nmon_linux_14i.tar.gz

或者:

gunzip nmon_linux_14i.tar.gz

tar –xvf nmon_linux_14i.tar

         AIX系统操作:

gunzip nmon_linux_14i.tar.gz

tar –xvf nmon_linux_14i.tar

1.3.2 重命名

mv nmon_x86_64_rhel54 nmon

1.3.3 软连接

  做软连接的目的是方便在各用户下执行nmon命令。

    ln -s  ./nmon /bin/nomn

1.3.4执行命令

Linux输入命令:

[root@redhat ~ ]# nmon

Unix操作系统监控详解(一)

分别输入c、t、n、m,可以了解系统CPU、消耗资源最高的线程、网络以及内存、的使用情况。

Unix操作系统监控详解(一)

输入h,打开nmon帮助页面,即对nmon命令的详细解释和说明。

Unix操作系统监控详解(一)

1.3.5 收集报告

   创建存放nmon报告的位置:

   [root@redhat ~ ]# mkdir -p /export/nmon

 生成nmon报告命令:

   [root@redhat ~ ]# nmon –c 10 –s 10 –f –m /export/nmon

意为:每10秒中采集一次,总计采集10次,并将报告放到/export/nmon目录下。

命令参数详解:

-f   电子表格输出格式 [注意: default -s300 -c288]

输出文件是 <hostname>_YYYYMMDD_HHMM.nmon

-F   <filename> 等同于 -f 但是使用用户提供的文件名

-r   <runname>  用于电子表格文件 [default hostname]

-t    include top processes in the output

-T   as -t plus saves command line arguments in UARG section

-s   <seconds>  采集数据的时间

-c   <number>   采集数据的次数

-d  <disks>    to increase the number of disks [default 256]

-l  <dpl>    disks/line default 150 to avoid spreadsheet issues.

-g  <filename> User Defined Disk Groups (see above)

-N  include NFS Network File System

-I  <percent> Include process & disks busy threshold (default 0.1)  don't save or show proc/disk using less than this percent

-m  <directory> 生成的数据文件的路径

二、nmon数据分析

2.1下载nmon analyser.xls工具

下载地址:

  32位和64位(支持office2010版本及以上版本)的nmon analyser分析工具包下载:

    http://pan.baidu.com/s/1dD03wbR   

2.2打开nmon analyser.xls工具

  调整Excel宏安全性,选择:工具-宏-安全性

  1) 修改安全级别与可靠发行商

  2)(选择)安全级别:低

  3)(勾上)信任所有安装的加载项和模板

  4)(勾上)信任对于“Visual Baisc项目”的访问

  改完后,确定,关闭nmon analyser.xls,重新打开nmon analyser v33g - for excel 2010 64 bits beta.xls。

2.3 加载*.nmon文件进行分析数据

  点击Analyse nmon data按钮,加载之前通过nmon –c 10 –s 10 –f –m /export/nmon命令生成的nmon报告。下载redhat_140322_1012.nmon文件,并浏览添加即可生成一份数据分析报告。

Unix操作系统监控详解(一)

2.6 设置定时收集

  编辑一个shell脚本,定时收集系统的性能报告,以下脚本仅做参考。

#!/bin/bash
retention_days=7
report_path=/export/nmon #生成nmon报告
nmon -c 100 -s 15 -f db_server -m ${report_path} #压缩生成的*.nmon报告
cd ${report_path}
gzip *.nmon #删除过期的*.gz的nmon报告
find /export/nmon -atime +${retention_days} -exec rm -rf {} \ ;

crontab定时任务:

* */1 * * * /export/nmon/auto_collect_nmon.sh 2> &1/dev/null

三、总结

  nmon软件是通过UNIX系统的多个命令串联起来,生成的系统性能报告。这些命令如:iostat、vmstat等。