Linux 性能监控之CPU&内存&I/O监控Shell脚本2

时间:2022-01-09 01:46:56

Linux 性能监控之CPU&内存&I/O监控Shell脚本2

 

by:授客 QQ1033553122

思路:

捕获数据->停止捕获数据->提取数据

备注:一些命令的输出,第一次记录的数据是自重启到当前时间的平均值,所以,如果采用循环的方式不断重复开启命令,获取的数据可能不太准确,所以,这里采用开启命令后,一次性捕获需要的数据。

(一) 捕获数据

用法:sh capture.sh arg1 arg2

参数说明:arg1为采样频率,arg2为采样时长,单位都为秒

例子:2秒采集一次数据,采样时长10秒,共采样5次

sh capture.sh 2 10

capture.sh内容如下:

#!/bin/bash

count=$(($2/$1))

echo $count

rm -f top.txt

rm -f vmstat.txt

rm -f iostat.txt

{ top -bd $1 -n $count >> top.txt; }&

{ vmstat -t -n -S K $1 $count >> vmstat.txt; }&

{ iostat -kx $1 $count >> iostat.txt; }&

wait

exit 0

说明:并发执行采集数据命令

(二)停止捕获数据

用法:sh stop.sh

说明:如果停止压测时还没到命令自动退出时间,可执行该脚本,停止数据捕获

stop.sh脚本内容如下:

#!/bin/bash

killall top

killall vmstat

killall iostat

exit 0

(三)提取数据

用法:sh analyze.sh agr1 arg2 arg3 arg4 arg5

参数说明:agr1,agr2,agr3分别为capture中指定的存储文件,默认分别为top.txt,vmstat.txt,iostat.txt,arg4为网卡接口,arg需要采集的进程(COMMAND)

例子:

sh analyze.sh top.txt vmstat.txt iostat.txt eth1 netns

analyze.sh 内容如下:

#!/bin/bash

# 获取要监控的本地服务器IP地址

IP=`ifconfig $4 | grep "inet addr" | cut -f 2 -d ":" | cut -f 1 -d " "`

echo "IP地址:"$IP

# 获取cpu总核数

cpu_num=`grep -c "model name" /proc/cpuinfo`

echo "cpu总核数:"$cpu_num

printf "\n"

# 1、获取CPU利用率

printf "获取cpu利用率\n"

printf "cpu_user\tcpu_system\tcpu_idle\tcpu_iowait\ttime\n"

record_num=`grep Cpu $1| wc -l`

for((i=1;i<=$record_num;i++))

do

# 获取时间

time=`grep "load average" $1 | sed -n ${i}"p" | awk '{print $3}'`

#echo "当前时间"$time

# 获取用户空间占用CPU百分比

cpu_user=`grep Cpu $1 | awk '{print $2}' |sed -n ${i}"p"| cut -f 1 -d "%"`

#echo "用户空间占用CPU百分比:"$cpu_user

# 获取内核空间占用CPU百分比

cpu_system=`grep Cpu $1 | awk '{print $3}' |sed -n ${i}"p" | cut -f 1 -d "%"`

#echo "内核空间占用CPU百分比:"$cpu_system

# 获取空闲CPU百分比

cpu_idle=`grep Cpu $1 | awk '{print $5}' |sed -n ${i}"p" | cut -f 1 -d "%"`

#echo "空闲CPU百分比:"$cpu_idle

# 获取等待输入输出占CPU百分比

cpu_iowait=`grep Cpu $1 | awk '{print $3}' |sed -n ${i}"p" | cut -f 1 -d "%"`

#echo "等待输入输出占CPU百分比:"$cpu_iowait

#echo $cpu_user " "$cpu_system " " $cpu_idle " " $cpu_iowait

printf "%.1f\t\t%.1f\t\t%.1f\t\t%.1f\t\t%s\n" $cpu_user $cpu_system $cpu_idle $cpu_iowait $time

done

printf "\n"

#2、获取CPU上下文切换和中断次数

printf "获取cpu中断和上下文切换次数\n"

printf "cpu_interrupt\tcpu_context_switch\ttime\n"

record_num=`cat $2 | wc -l`

for((i=3;i<=$record_num;i++))

do

# 获取时间

time=`sed -n ${i}"p" $2 | awk '{print $19}'`

#echo "当前时间"$time

# 获取CPU中断次数

cpu_interrupt=`sed -n ${i}"p" $2 | awk '{print $11}'`

#echo "CPU中断次数:"$cpu_interrupt

# 获取CPU上下文切换次数

cpu_context_switch=`sed -n ${i}"p" $2 | awk '{print $12}'`

#echo "CPU上下文切换次数:"$cpu_context_switch

printf "%d\t\t%d\t\t\t%s\n" $cpu_interrupt $cpu_context_switch $time

done

printf "\n"

#3、获取CPU负载信息

printf "\n获取CPU负载信息-15,5,1分钟前到现在的负载均值\n"

printf "cpu_load_15min\tcpu_load_5min\tcpu_load_1min\ttime\n"

record_num=`grep "load average" $1 | wc -l`

for((i=1;i<=$record_num;i++))

do

# 获取时间

time=`grep "load average" $1 | sed -n ${i}"p" | awk '{print $3}'`

#echo "当前时间"$time

# 获取CPU15分钟前到现在的负载平均值

cpu_load_15min=`grep "load average" $1 | sed -n ${i}"p" | awk '{print $12}' | cut -f 1 -d ','`

#echo "CPU 15分钟前到现在的负载平均值:"$cpu_load_15min

# 获取CPU5分钟前到现在的负载平均值

cpu_load_5min=`grep "load average" $1 | sed -n ${i}"p" | awk '{print $11}' | cut -f 1 -d ','`

#echo "CPU 5分钟前到现在的负载平均值:"$cpu_load_5min

# 获取CPU1分钟前到现在的负载平均值

cpu_load_1min=`grep "load average"  $1 | sed -n ${i}"p" | awk '{print $10}' | cut -f 1 -d ','`

#echo "CPU 1分钟前到现在的负载平均值:"$cpu_load_1min

printf "%.2f\t\t%.2f\t\t%.2f\t\t%s\n" $cpu_load_15min $cpu_load_5min $cpu_load_1min $time

done

printf "获取CPU负载信息-cpu队列长度\n"

printf "cpu_task_length\ttime\n"

record_num=`cat $2 | wc -l`

for((i=3;i<=$record_num;i++))

do

# 获取时间

time=`sed -n ${i}"p" $2 | awk '{print $19}'`

#echo "当前时间"$time

# 获取任务队列(就绪状态等待的进程数)

cpu_task_length=`sed -n ${i}"p" $2 | awk '{print $1}'`

#echo "CPU任务队列长度:"$cpu_task_length

printf "%d\t\t%s\n" $cpu_task_length $time

done

printf "\n"

#4、获取内存信息

printf "获取内存信息\n"

printf "mem_total\tmem_sys_used\tmem_sys_free\tmem_user_used\tmem_user_free\tmem_buffers\tmem_swap_total\tmem_swap_used\tmem_swap_free\tmem_swap_cached\ttime\n"

record_num=`grep Mem $1 | wc -l`

for((i=1;i<=$record_num;i++))

do

# 获取时间

time=`grep "load average" $1 | sed -n ${i}"p" | awk '{print $3}'`

#echo "当前时间"$time

# 获取物理内存总量

mem_total=`grep Mem $1 | sed -n ${i}"p" | awk '{print $2}' | cut -f 1 -d 'k'`

#echo "物理内存总量:"$mem_total

# 获取操作系统已使用内存总量

mem_sys_used=`grep Mem $1 | sed -n ${i}"p" | awk '{print $4}' | cut -f 1 -d 'k'`

#echo "已使用内存总量(操作系统):"$mem_sys_used

# 获取操作系统未使用内存总量

mem_sys_free=`grep Mem $1 | sed -n ${i}"p" | awk '{print $6}' | cut -f 1 -d 'k'`

#echo "剩余内存总量(操作系统):"$mem_sys_free

# 获取应用程序已使用的内存总量

mem_buffers=`grep Mem $1 | sed -n ${i}"p" | awk '{print $8}' | cut -f 1 -d 'k'`

mem_swap_cached=`grep Swap $1 | sed -n ${i}"p" | awk '{print $8}' | cut -f 1 -d 'k'`

mem_user_used=$(($mem_sys_used-$mem_buffers-$mem_swap_cached))

#echo "已使用内存总量(应用程序):"$mem_user_used

# 获取应用程序未使用内存总量

mem_user_free=$(($mem_sys_free+$mem_buffers+$mem_swap_cached))

#echo "剩余内存总量(应用程序):"$mem_user_free

# 获取交换分区总大小

mem_swap_total=`grep Swap $1 | sed -n ${i}"p" | awk '{print $2}' | cut -f 1 -d 'k'`

#echo "交换分区总大小:"$mem_swap_total

# 获取已使用交换分区大小

mem_swap_used=`grep Swap $1 | sed -n ${i}"p" | awk '{print $4}' | cut -f 1 -d 'k'`

#echo "已使用交换分区大小:"$mem_swap_used

# 获取剩余交换分区大小

mem_swap_free=`grep Swap $1 | sed -n ${i}"p" | awk '{print $6}' | cut -f 1 -d 'k'`

#echo "剩余交换分区大小:"$mem_swap_free

printf "%d\t\t%d\t\t%d\t\t%d\t\t%d\t\t%d\t\t%d\t\t%d\t\t%d\t\t%d\t\t%s\n" $mem_total $mem_sys_used $mem_sys_free $mem_user_used $mem_user_free $mem_buffers $mem_swap_total $mem_swap_used $mem_swap_free $mem_swap_cached $time

done

printf "\n"

#5、获取磁盘I/O统计信息

echo "指定设备(/dev/sda1)的统计信息"

printf "disk_sda_rs\tdisk_sda_ws\tdisk_sda_avgqu_sz\tdisk_sda_await\tdisk_sda_svctn\tdisk_sda_util\ttime\n"

record_num=`grep sda $3 | wc -l`

for((i=1;i<=$record_num;i++))

do

# 获取时间

time=`grep "load average" $1 | sed -n ${i}"p" | awk '{print $3}'`

#echo "当前时间"$time

# 每秒向设备发起的读请求次数

disk_sda_rs=`grep sda $3 | sed -n ${i}"p" | awk '{print $4}'`

#echo "每秒向设备发起的读请求次数:"$disk_sda_rs

# 每秒向设备发起的写请求次数

disk_sda_ws=`grep sda $3 | sed -n ${i}"p" | awk '{print $5}'`

#echo "每秒向设备发起的写请求次数:"$disk_sda_ws

# 向设备发起的I/O请求队列长度平均值

disk_sda_avgqu_sz=`grep sda $3 | sed -n ${i}"p" | awk '{print $9}'`

#echo "向设备发起的I/O请求队列长度平均值"$disk_sda_avgqu_sz

# 每次向设备发起的I/O请求平均时间

disk_sda_await=`grep sda $3 | sed -n ${i}"p" | awk '{print $10}'`

#echo "每次向设备发起的I/O请求平均时间:"$disk_sda_await

# 向设备发起的服务时间均值

disk_sda_svctm=`grep sda $3 | sed -n ${i}"p" | awk '{print $11}'`

#echo "向设备发起的服务时间均值:"$disk_sda_svctm

# 向设备发起I/O请求的CPU时间百分占比

disk_sda_util=`grep sda $3 | sed -n ${i}"p"| awk '{print $12}'`

#echo "向设备发起I/O请求的CPU时间百分占比:"$disk_sda_util

printf "%.2f\t\t%.2f\t\t%.2f\t\t\t%.2f\t\t%.2f\t\t%.2f\t\t%s\n" $disk_sda_rs $disk_sda_ws $disk_sda_avgqu_sz $disk_sda_await $disk_sda_svctm $disk_sda_util $time

done

printf "\n"

#6、获取某个进程的CPU、内存使用信息

printf "获取某个进程的CPU、内存使用信息\n"

printf "proc_id\tproc_cpu\tproc_mem\tproc_vsz\ttime\n"

record_num=`grep $5 $1 | wc -l`

for((i=1;i<=$record_num;i++))

do

# 获取时间

time=`grep "load average" $1 | sed -n ${i}"p" | awk '{print $3}'`

#echo "当前时间:"$time

# 获取进程ID

proc_id=`grep $5 $1 | sed -n ${i}"p" | awk '{print $1}'`

#echo "进程ID:"$proc_id

# 获取进程CPU使用率

proc_cpu=`grep $5 $1 | sed -n ${i}"p" | awk '{print $3}'`

#echo "进程CPU使用率:"$proc_cpu

# 获取进程内存使用率

proc_mem=`grep $5 $1 | sed -n ${i}"p" | awk '{print $4}'`

#echo "进程内存使用率:"$proc_mem

# 获取进程虚拟内存总量

proc_vsz=`grep $5 $1 | sed -n ${i}"p" | awk '{print $5}'`

#echo "进程使用的虚拟内存总量:"$proc_vsz

printf "%d\t\t%.1f\t\t%.1f\t\t%d\t\t%s\n" $proc_id $proc_cpu $proc_mem $proc_vsz $time

done

注:获取磁盘I/O统计信息,这里收集的时间数据是大致时间-top取样时的时间,非精确时间,有可能存在较大误差

效果如下:

Linux 性能监控之CPU&内存&I/O监控Shell脚本2

Linux 性能监控之CPU&内存&I/O监控Shell脚本2

注:针对不同类型、版本的操作系统,以上脚本可能需要做适当修改才可适用

附脚本下载地址:Linux 性能监控之CPU&内存&I/O监控Shell脚本2.zip

Linux 性能监控之CPU&内存&I/O监控Shell脚本2的更多相关文章

  1. Linux&&num;160&semi;性能监控之CPU&amp&semi;内存&amp&semi;I&sol;O监控Shell脚本1

    Linux 性能监控之CPU&内存&I/O监控Shell脚本1   by:授客 QQ:1033553122   #!/bin/bash # 获取要监控的本地服务器IP地址 IP=`if ...

  2. 一个统计 CPU 内存 硬盘 使用率的shell脚本

    一个统计 CPU 内存 硬盘 使用率的shell脚本,供大家学习参考 #!/bin/bash #This script is use for describle CPU Hard Memery Uti ...

  3. 【转】一文掌握 Linux 性能分析之 CPU 篇

    [转]一文掌握 Linux 性能分析之 CPU 篇 平常工作会涉及到一些 Linux 性能分析的问题,因此决定总结一下常用的一些性能分析手段,仅供参考. 说到性能分析,基本上就是 CPU.内存.磁盘 ...

  4. linux性能问题(CPU,内存,磁盘I&sol;O,网络)

    一. CPU性能评估 1.vmstat [-V] [-n] [depay [count]] -V : 打印出版本信息,可选参数 -n : 在周期性循环输出时,头部信息仅显示一次 delay : 两次输 ...

  5. 测网速 fping Linux查看网络即时网速 linux性能问题(CPU,内存,磁盘I&sol;O,网络)

    Linux查看网络即时网速 fping 是ping 工具的加强版本 例出局域网中存活的主机 (Ubuntu apt-get装上  cnetos装不上) zzx@zzx11:~$ fping -a 19 ...

  6. Linux性能监测:CPU篇&lpar;转&rpar;

    http://os.51cto.com/art/201012/239880.htm CPU 的占用主要取决于什么样的资源正在 CPU 上面运行,比如拷贝一个文件通常占用较少 CPU,因为大部分工作是由 ...

  7. Linux 性能监测:CPU

    CPU 的占用主要取决于什么样的资源正在 CPU 上面运行,比如拷贝一个文件通常占用较少 CPU,因为大部分工作是由 DMA(Direct Memory Access)完成,只是在完成拷贝以后给一个中 ...

  8. 一文掌握 Linux 性能分析之 CPU 篇

    本文首发于我的公众号 Linux云计算网络(id: cloud_dev),专注于干货分享,号内有 10T 书籍和视频资源,后台回复「1024」即可领取,欢迎大家关注,二维码文末可以扫. 平常工作会涉及 ...

  9. Linux性能监测:CPU篇

    CPU 也是一种硬件资源,和任何其他硬件设备一样也需要驱动和管理程序才能使用,我们可以把内核的进程调度看作是 CPU 的管理程序,用来管理和分配 CPU 资源,合理安排进程抢占 CPU,并决定哪个进程 ...

随机推荐

  1. Undefined symbols for architecture x86&lowbar;64&colon; &quot&semi;&lowbar;OBJC&lowbar;CLASS&lowbar;&dollar;&lowbar;GiftAnimationView&quot&semi;

    1> error 详情: Undefined symbols for architecture x86_64: "_OBJC_CLASS_$_GiftAnimationView&quo ...

  2. &lbrack;ActionScript 3&period;0&rsqb; AS3&period;0 复制xml,并赋值

    var template:XML= <person><name><first>FIRST</first><last /></name& ...

  3. Spring AOP:面向切面编程,AspectJ,是基于spring 的xml文件的方法

    导包等不在赘述: 建立一个接口:ArithmeticCalculator,没有实例化的方法: package com.atguigu.spring.aop.impl.panpan; public in ...

  4. iPhone和iPad版本的分辨率a

  5. Python运行Google App Engineer时出现的UnicodeDecodeError错误解决方案

    #Python运行Google App Engineer时出现的UnicodeDecodeError错误解决方案   ##问题描述 使用Python2.7.x运行GAE时有时会报这个错误 ```py ...

  6. 让你分分钟学会 JS 闭包

    闭包,是 javascript 中重要的一个概念,对于初学者来讲,闭包是一个特别抽象的概念,特别是ECMA规范给的定义,如果没有实战经验,你很难从定义去理解它.因此,本文不会对闭包的概念进行大篇幅描述 ...

  7. Android 之 ExpandableListView 的使用

    喜欢显示好友QQ那样的列表,可以展开,可以收起,在android中,以往用的比较多的是listview,虽然可以实现列表的展示,但在某些情况下,我们还是希望用到可以分组并实现收缩的列表,那就要用到an ...

  8. Clustering text documents using k-means

    源代码的链接为http://scikit-learn.org/stable/auto_examples/text/document_clustering.html Loading 20 newsgro ...

  9. 全面理解虚拟DOM(1)

    最近一两年前端最火的技术莫过于 reactjs,angularJS,vuejs,即便你没用过也可能听过,像ReactJS由业界顶尖的互联网公司facebook提出,其本身有很多先进的设计思路,比如页面 ...

  10. BizTalk RosettaNet解决方案搭建

    contoso为证书颁发机构 分别在两台服务器中配置hosts 192.168.199.160 fabrikam 192.168.199.225 contoso 安装CA 控制面板,添加删除程序 打开 ...