系统运维相关的知识

时间:2022-08-07 21:52:02

OMS中间件系统运行报告

 

                                                        起始日期:2015年7月1日-终止日期:2015/7月30日

 

 

前言

1,本报告主机就与oms中间件相关的各项系统的各项工作,包括应用系统,操作系统,版本发布及变更,附件等进行记录,分析汇总和报告,以保障oms的安全、稳定、高效运行,支持业务、管理及各项工作开展。

2,本报告为月度报告,报告周期为公历每月第一日到每月末的最后一天。

 

一、中间件部分

(一)OMS中间件系统运行

1、主要业务中间件

序号

简称

中文名称

运行态势

1

Was

应用服务中间件

运行良好

2

Redis

Redis缓存服务器

运行良好

2、其他相关系统

序号

简称

中文名称

运行态势

1

 

 

 

 

3、系统间接口

序号

简称

中文名称

运行态势

1

EBS

企业服务总线

运行良好

2

DB2

DB2数据库

运行良好

 

4.运行情况总体描述(分系统)

1,主机运行整体运行良好。

2,监控系统整体运行良好。

3,与数据库之间运行良好。

(二)应用系统升及发布

1、主要业务系统升级及发布

序号

系统简称

升级及发布描述

获取日期

升级日期

备注(是否反馈)

 

 

 

 

 

 

 

 

 

 

 

 

2、升级及发布情况说明

l  无升级计划,日前处于稳定运行中。

l  发布计划(???)

(三)应用系统运行日志检查

1、系统运行日志检查

序号

系统简称

日志运行

上线、暂停、变更情况

备注(是否反馈)

 

 

 

 

 

 

 

 

 

 

2、系统运行日志检查

l  与数据库及ebus运行日志显示系统、设备、应用、接口运行良好

l  系统环境日志显示系统软硬件运行良好

l  系统发布()截止目前为止运行良好

(四)应用系统维护

1、维护单情况统计

序号

维护单目的

问题提出数

问题解决数

问题上报数

备注(是否反馈)

 

 

 

 

 

 

 

 

 

 

 

 

2、主要大类问题原因分析及解决建议

l  1

l  2

l  3

 

五,性能状况分析

服务器运行情况

         1,磁盘空间

         2,内存空间

         cat/etc/cron.d/sysstat 

查看每分钟的具体信息

 

-rw-r--r--  1 root root 454128 Mar 1223:50 sa12

-rw-r--r--  1 root root 454128 Mar 1323:50 sa13

-rw-r--r--  1 root root 454128 Mar 1423:50 sa14

-rw-r--r--  1 root root 454128 Mar 1523:50 sa15

-rw-r--r--  1 root root 454128 Mar 1623:50 sa16

-rw-r--r--  1 root root 454128 Mar 1723:50 sa17

-rw-r--r--  1 root root 454128 Mar 1823:50 sa18

-rw-r--r--  1 root root 454128 Mar 1923:50 sa19

-rw-r--r--  1 root root  34912Mar 20 01:20 sa20

-rw-r--r--  1 root root 461828 Mar 1223:53 sar12

-rw-r--r--  1 root root 461828 Mar 1323:53 sar13

-rw-r--r--  1 root root 461828 Mar 1423:53 sar14

-rw-r--r--  1 root root 461828 Mar 1523:53 sar15

-rw-r--r--  1 root root 461828 Mar 1623:53 sar16

-rw-r--r--  1 root root 461828 Mar 1723:53 sar17

-rw-r--r--  1 root root 461828 Mar 1823:53 sar18

-rw-r--r--  1 root root 461828 Mar 1923:53 sar19

 

其中,sa是每十分钟的性能数据

而sar是每一天的性能数据

sar的cpu

sar

 

查看cpu的使用情况:

 /usr/bin/sar -q -f sa12

06:20:01 PM   runq-sz  plist-sz  ldavg-1   ldavg-5  ldavg-15

06:30:01 PM         0      230      0.02      0.04     0.00

06:40:01 PM         0      229      0.10      0.17     0.07

06:50:01 PM         0      228      0.08      0.08     0.07

07:00:01 PM         0      226      0.10      0.06     0.04

07:10:01 PM         0      225      0.08      0.32     0.20

07:20:01 PM         0      226      0.00      0.05     0.09

07:30:01 PM         0      227      0.01      0.05     0.07

07:40:02 PM         0      226      0.16      0.16     0.10

07:50:01 PM         0      226      0.03      0.05     0.06

08:00:01 PM         0      228      0.00      0.00     0.01

08:10:01 PM         0      226      0.11      0.59     0.47

08:20:01 PM         0      226      0.06      0.12     0.26

08:30:01 PM         0      226      0.01      0.04     0.14

08:40:01 PM         0      226      0.12      0.15     0.12

08:50:01 PM         0      226      0.08      0.07     0.08

09:00:01 PM         0      227      0.03      0.05     0.06

09:10:01 PM         0      227      0.01      0.02     0.02

09:20:01 PM         0      226      0.08      0.04     0.01

09:30:01 PM         0      226      0.00      0.02     0.00

09:40:01 PM         0      227      0.22      0.21     0.08

09:50:01 PM         0      225      0.11      0.11     0.08

10:00:01 PM         0      226      0.06      0.04     0.06

runq-sz:runqueue length (number of tasks waiting for run time )等待执行的任务队列长度。越长阻塞越严重   

 

plist-sz : Nubmer of taskof in the task list ,队列中的任务总数,如果队列越多,则负载越高

 

 ldavg-1:systemload average for last minute.the load average is calculated as theaverage 

number of runable orrunning tasks (R state ).and the number of tasks in uninterruptible sleep (Dstate)

over the specifiedinterval 

1分钟,5分钟,15分钟的内系统负载描述

值是通过执行中的任务和等待执行的任务的个数的平均得到 的

如果值等于cpu的个数的时候,则相应的负载就很高了

 

cpu占用百分比:

sar -p -f sa08

10:00:01 PM      CPU     %user     %nice   %system  %iowait    %steal     %idle

10:10:01 PM      all      0.90      0.00     0.16      0.96      0.00    97.98

10:20:01 PM      all      0.22      0.00     0.08      0.20      0.00    99.49

10:30:01 PM      all      0.42      0.01     0.19      0.30      0.00    99.08

10:40:01 PM      all      1.94      0.00     1.04      0.21      0.00    96.81

10:50:01 PM      all      4.89      0.00     2.65      0.27      0.00    92.19

11:00:01 PM      all      0.34      0.00     0.15      0.22      0.00    99.29

11:10:01 PM      all      1.82      0.00     0.97      0.25      0.00    96.95

11:20:01 PM      all      4.81      0.00     2.69      0.21      0.00    92.29

11:30:01 PM      all      0.39      0.01     0.17      0.21      0.00    99.23

11:40:01 PM      all      0.30      0.00     0.14      0.19      0.00    99.37

11:50:01 PM      all      0.29      0.00     0.13      0.18      0.00    99.40

Average:         all      1.09      0.00     0.48      0.32      0.00    98.12

 

PRI:进程优先权,代表这个进程可被执行的优先级,其值越小,则优先级越高,越早被执行

NI:进程Nice值,进程可被执行优先级的修正值PRI(new) =PRI(old)+nice 

%nice :改变优先级的进程cpu占用率

%steal:管理程序 等待cpu ,如果这个值越高,则cpu的繁重承度越高

 

内存监控:

sar -r -f sa14 

5:20:01 PM kbmemfree kbmemused %memused kbbuffers  kbcached kbswpfree kbswpused  %swpused kbswpcad

05:30:01 PM   5150396   3158920    38.02     43272   2775444   6738324  3550820     34.51       272

05:40:01 PM   5136604   3172712    38.18     44528   2786664   6738324  3550820     34.51       272

05:50:01 PM   5144008   3165308    38.09     45772   2789828   6738324  3550820     34.51       272

06:00:01 PM   5120756   3188560    38.37     47000   2797632   6738324  3550820     34.51       272

06:10:01 PM   5100240   3209076    38.62     48288   2823000   6738328  3550816     34.51       272

06:20:01 PM   5103304   3206012    38.58     49468   2824792   6738328  3550816     34.51       272

06:30:01 PM   5079028   3230288    38.88     50760   2838960   6738328  3550816     34.51       272

06:40:01 PM   5068076   3241240    39.01     52004   2849572   6738328  3550816     34.51       272

06:50:01 PM   5029756   3279560    39.47     53292   2895540   6738328  3550816     34.51       272

07:00:01 PM   5035612   3273704    39.40     54528   2896480   6738328  3550816     34.51       272

07:10:01 PM   4982248   3327068    40.04     55904   2951032   6738332  3550812     34.51       268

07:20:01 PM   4978536   3330780    40.08     57080   2951184   6738332  3550812     34.51       268

07:30:01 PM   4969684   3339632    40.19     58344   2951892   6738332  3550812     34.51       268

07:40:02 PM   4969944   3339372    40.19     59556   2952476   6738332  3550812     34.51       268

07:50:01 PM   4968340   3340976    40.21     60744   2952696   6738332  3550812     34.51       268

08:00:01 PM   4969648   3339668    40.19     61936   2952932   6738332  3550812     34.51       268

08:10:01 PM    630528  7678788     92.41     12176   7325364   6736652  3552492     34.53        76

08:20:01 PM    555060  7754256     93.32     13640   7400172   6736652  3552492     34.53        76

08:30:01 PM    529368  7779948     93.63     15580   7423888   6736652  3552492     34.53        76

08:40:01 PM    787536  7521780     90.52     16032   7157644   6737240  3551904     34.52       100

08:50:01 PM    777580  7531736     90.64     17252   7165808   6737240  3551904     34.52       100

09:00:01 PM    777704  7531612     90.64     18496   7169664   6737240  3551904     34.52       100

09:10:01 PM    740480  7568836     91.09     19956   7206192   6737240  3551904     34.52       100

kbmemfree 内存使用的空闲值

kbmemused  内存的使用情况

%memused:内存的使用率

kbbuffers  :对磁盘块的缓存 比文件更底层

kbcached :对文件的缓存

kbswpfree 

kbswpused  

%swpused

kbswpcad

buffer/cached 是为了提高文件读取性能的磁盘缓存

 

sar -B -f sa14

05:20:01 PM  pgpgin/s pgpgout/s  fault/s  majflt/s

05:30:01 PM      3.43    52.88    701.48      0.00

05:40:01 PM     11.06    34.22    276.89      0.00

05:50:01 PM      3.90    35.13    222.18      0.00

06:00:01 PM      2.65    33.76    268.97      0.00

06:10:01 PM     58.69   197.54    906.76      0.01

06:20:01 PM      0.35    45.76    236.23      0.00

06:30:01 PM      2.38    58.40    430.53      0.00

06:40:01 PM      0.27    33.41    299.91      0.00

06:50:01 PM      1.22    45.97    533.63      0.00

07:00:01 PM      0.49    31.04    222.84      0.00

07:10:01 PM      0.85    51.12    494.37      0.00

07:20:01 PM      0.86   111.17    372.26      0.00

第一部分: pgpgin/spgpgout/s 内存页的切换换进,换出

第二部分:fault/s每秒钟系统产生的缺页数majflt/s,这个我们

看一下swap的交换的使用

 

sar -W -f sa14

06:20:01 PM  pswpin/s pswpout/s

06:30:01 PM      0.00     0.00

06:40:01 PM      0.00     0.00

06:50:01 PM      0.00     0.00

07:00:01 PM      0.00     0.00

07:10:01 PM      0.00     0.00

跟Swap之间的交换很小

 

看一下io

sar -b -f sa08 

06:20:01 PM       tps     rtps      wtps   bread/s   bwrtn/s

06:30:01 PM     24.87     4.29     20.58    137.11    269.97

06:40:01 PM     15.38     1.96     13.41    103.43    184.42

06:50:01 PM     36.64     0.74     35.90     20.40    674.87

07:00:01 PM     15.56     0.58     14.98      9.28   201.11

07:10:01 PM    313.60    27.99    285.61    471.21   4111.74

07:20:01 PM     13.51     0.10     13.41      1.44   184.77

07:30:01 PM     17.09     0.26     16.83      4.00   240.63

07:40:02 PM     13.08     0.28     12.80      4.44   174.43

07:50:01 PM     13.09     0.26     12.84      3.33   174.88

08:00:01 PM     12.46     0.14     12.33      2.25   168.55

08:10:01 PM   1493.94   471.01   1022.93 101762.58  23291.99

tps每秒物理设备的i/o请求次数

rtps:每秒钟从物理设备读入的请求次数

wtps:每秒钟向物理设备写入的请求次数

bread/s每秒钟从物理设备读入的数据量,单位为块/s

bwrtn/s每秒钟向物理设备写入的数据量,单位为块/s

 

/usr/bin/sar -d -f sa12 

rd_sec/s   

        综上所述:sar -r,是对内存进行统计

        sar -n DEV可以用来查看网络统计

           

 

WAS主机运行状况

         1,

 

REDIS主机运行状况