系统版本:CentOS 7.4
top
17:49:04 // 当前时间
up 3:55 // 系统运行时间,格式为时:分
2 users // 当前登录用户数
load average // 三个值分别为 1分钟,5分钟,15分钟内的系统负载,当这个值超过 CPU 可执行单元的数目,表示 CPU 的性能已成为瓶颈。
Tasks // 进程总数
running // 正在运行的进程数,包括正在 CPU 上运行的和将要被调度运行的
sleeping // 睡眠的进程数, 通常是等待事件(比如 IO 操作)完成的任务,细分可以包括 interruptible 和 uninterruptible 的类型;
stopped // 停止的进程数
zombie // 僵尸进程数
us // 用户空间占用 CPU 百分比
sy // 内核空间占用 CPU 百分比,操作系统通过系统调用(system call)从用户态陷入内核态,以执行特定的服务;但是当服务器执行的 IO 比较
密集的时候,该值会比较大
ni // 用户进程空间内改变过优先级的进程占用CPU百分比
id // 空闲CPU百分比
wa // 等待 IO 输入输出的CPU时间百分比
hi // 硬中断占用百分比
si // 软中断占用百分比
st // 虚拟机占用百分比
PID // 每个进程的 ID
USER // 每个进程所有者的用户名
PR // 每个进程的优先级别
NI // 该进程的优先级值
VIRT // 进程需要的虚拟内存大小,包括进程使用的库,代码,数据等
RES // 该进程占用的物理内存的总数量,单位是 KB
SHR // 该进程使用共享内存的数量
S // 进程状态(D=不可中断的睡眠状态,R=运行,S=睡眠,T=跟踪/停止, Z=僵尸进程)
%CPU // 该进程自最近一次刷新一来所占用的CPU时间和总时间的百分比
%MEM // 该进程占用的物理内存占总内存的百分比
TIME+ // 该进程自启动以来所占用的总 CPU 时间。
COMMAND // 该进程的命令名称。
CPU 占用率高很多情况下意味着一些东西,这也给服务器 CPU 使用率过高情况下指明了相应地排查思路:
当 user 占用率过高的时候,通常是某些个别的进程占用了大量的 CPU,这时候很容易通过 top 找到该程序;此时如果怀疑程序异常,可以通过 perf 等思路找出热点调用函数来进一步排查;
当 system 占用率过高的时候,如果 IO 操作(包括终端 IO)比较多,可能会造成这部分的 CPU 占用率高,比如在 file server、database server 等类型的服务器上,否则(比如>20%)很可能有些部分的内核、驱动模块有问题;
当 nice 占用率过高的时候,通常是有意行为,当进程的发起者知道某些进程占用较高的 CPU,会设置其 nice 值确保不会淹没其他进程对 CPU 的使用请求;
当 iowait 占用率过高的时候,通常意味着某些程序的 IO 操作效率很低,或者 IO 对应设备的性能很低以至于读写操作需要很长的时间来完成;
当 irq/softirq 占用率过高的时候,很可能某些外设出现问题,导致产生大量的irq请求,这时候通过检查 /proc/interrupts 文件来深究问题所在;
当 steal 占用率过高的时候,黑心厂商虚拟机超售了!
uptime
14:01:02 //系统当前时间
up 3 days, 7 min //主机已运行时间
2 users //当前登录用户数
load average: 0.00, 0.01, 0.05 //三个值分别为 1分钟,5分钟,15分钟内的系统负载
vmstat
(Procs) r // 运行队列中进程数量
(Procs) b // 等待 IO 的进程数量
(Memory) swpd // 使用虚拟内存大小
(Memory) free // 可用内存大小
(Memory) buff // 用作缓冲的内存大小
(Memory) cache // 用作缓存的内存大小
(Swap) si // 每秒从交换区写到内存的大小
(Swap) so // 每秒写入交换区的内存大小
(IO) bi // 每秒读取的块数
(IO) bo // 每秒写入的块数
(System) in // 每秒中断数,包括时钟中断
(System) cs // 每秒上下文切换数
(CPU) us // 用户进程执行时间 (user time)
(CPU) sy // 系统进程执行时间 (system time)
(CPU) id // 空闲时间(包括 IO 等待时间)
(CPU) wa // 等待IO时间
mpstat
%user // 表示处理用户进程所使用CPU的百分比。用户进程是用于应用程序(如Oracle数据库)的非内核进程;
%nice // 表示使用nice命令对进程进行降级时CPU的百分比;
%sys // 表示内核进程使用的CPU百分比;
%iowait // 表示等待进行I/O所使用的CPU时间百分比;
%irq // 表示用于处理系统中断的CPU百分比;
%soft // 表示用于软件中断的CPU百分比;
%idle // 显示CPU的空闲时间;
sar
%user // 显示在用户级别(application)运行使用CPU总时间的百分比。
%nice // 显示在用户级别,用于nice操作(进程优先级切换),所占用CPU总时间的百分比
%system // 在核心级别(kernel) 运行所使用CPU总时间的百分比。
%iowait // 显示用于等待I/O操作占用CPU总时间的百分比。
%steal // 管理程序(hypervisor)为另一虚拟进程提供服务而等待虚拟CPU的百分比。
%idle // 显示CPU空闲时间占用CPU总时间的百分比。
1.若 %iowait 的值过高,表示硬盘存在I/O瓶颈
2.若 %idle 高但是系统响应慢时,可能是CPU等待分配内存,此时应加大内存容量
3.若 %idle 的值持续低于1,则系统的CPU处理能力相对较低,表明系统中最需要解决的资源是CPU。
如果要查看二进制文件 test 中的内容,需键入如下sar命令:
sar -u -f test
-u : 输出cpu使用情况和统计信息
-f : 从制定的文件读取报告
pidstat
PID // 进程ID
%usr // 进程在用户空间占用cpu的百分比
%system // 进程在内核空间占用cpu的百分比
%guest // 进程在虚拟机占用cpu的百分比
%CPU // 进程占用cpu的百分比
CPU // 处理进程的cpu编号
Command // 当前进程对应的命令
UID // 执行进程的 UID
PID // 进程ID
%usr // 进程在用户空间占用cpu的百分比
%system // 进程在内核空间占用cpu的百分比
%guest // 进程在虚拟机占用cpu的百分比
%CPU // 进程占用cpu的百分比
CPU // 处理进程的cpu编号
Command // 当前进程对应的命令