Mongodb 监测

时间:2024-04-12 08:03:11

原文地址:伍仪洲的博客

介绍

为什么要进行监控状态,因为在实际的情况中可能会发生一下无法预计的情况,比如阻塞的问题,阻塞的原因会有很多种情况造成,如果当我们查询文档的时候发生了阻塞,那么就会影响到后面的操作,甚至无法对后面的操作进行响应。

我们可以通过监控很快速的找到到底是哪里出了问题,这样有助于我们快速定位所在的问题,从而得到解决。

Mongodb官方提供了三种用语分析Mongodb的方式:

  1. Mongodb自带的监控工具:用于提供数据库活动的实时报告
  2. 数据库命令:以更真实的情况返回数据库状态的统计信息
  3. 第三方平台托管监控

Mongodb自带监控工具

mongostat

mongostat是官方随同mongodb下载包中一同下载的,你可以找到安装目录或者解压目录进行使用。

我们可以通过mongostat --help()进行查询可用选项,也可以通过官方文档进行查询。

Mongostat默认所返回的信息都是基于秒为单位,比如返回的insert指的是每秒插入数据库的对象数,而如果我们限制了返回时间,那么这个返回的结果是基于限制时间的平均值。

-O 和 -o

这两个选项功能非常实用,按照正常的情况,Mongostat输出的报告会有很多我们不需要的列,所以我们可以通过-o来实现,这个选项设置后只会包含我们选择想要列,并且这个选项可以重新命名列的名字,除此之外-o-O还可以添加一些服务器状态到报表中,可以参考ServerStatus

默认的mongostat输出的内容大概如下,并且每秒钟都会返回一个状态:

insert query update delete getmore command flushes mapped vsize   res faults qrw arw net_in net_out conn                time
    *0    *0     *0     *0       0     2|0       0     0B 2.39G 14.0M      0 0|0 0|0   286b   13.8k    1 Aug 24 17:34:17.615
    *0    *0     *0     *0       0     1|0       0     0B 2.39G 14.0M      0 0|0 0|0   285b   13.7k    1 Aug 24 17:34:18.618
    *0    *0     *0     *0       0     2|0       0     0B 2.39G 14.0M      0 0|0 0|0   286b   13.8k    1 Aug 24 17:34:19.617
    *0    *0     *0     *0       0     1|0       0     0B 2.39G 14.0M      0 0|0 0|0   285b   13.8k    1 Aug 24 17:34:20.617

下面的代码选项是重命名了insert列为cr,并只显示insert,query,update:

$ mongostat --host localhost -o 'insert=cr,query,update'

返回后的文档大概如下:
cr query update
*0    *0     *0
*0    *0     *0
*0    *0     *0
*0    *0     *0

-O选项除了输出默认的列之外,可以重命名列名,还可以添加ServerStatus一些字段输出到报表,比如插入文档的总数、主机地址、版本号等信息。

$ mongostat --host localhost -O 'insert=cr,host,version'

返回后的文档大概如下:

cr query update delete getmore command flushes mapped vsize   res faults qrw arw net_in net_out conn                time cr            host version
*0    *0     *0     *0       0     2|0       0     0B 2.39G 14.0M      0 0|0 0|0   286b   13.8k    2 Aug 24 17:51:34.031 *0 localhost:27040   3.4.6
*0    *0     *0     *0       0     1|0       0     0B 2.39G 14.0M      0 0|0 0|0   285b   13.8k    2 Aug 24 17:51:35.032 *0 localhost:27040   3.4.6
*0    *0     *0     *0       0     2|0       0     0B 2.39G 14.0M      0 0|0 0|0   286b   13.8k    2 Aug 24 17:51:36.032 *0 localhost:27040   3.4.6

--rowcount

--rowcount可以控制mongostat返回报表的频率,--rowcount接受的第一个参数为返回的次数,第二个参数是多少秒生成一次报表并返回。

比如我想每五秒返回一次报表,共返回十次:

$ mongostat --rowcount 10 5

--discover

监控副本集或分片的所有成员的统计信息。

mongotop

mongotop可以监控数据库或者副本集的成员中哪个集合最为繁忙。

$ mongotop --host localhost:27030

返回大概如下内容:

                  ns    total    read    write    2017-08-25T20:50:06+08:00
  admin.system.roles      0ms     0ms      0ms
admin.system.version      0ms     0ms      0ms
   local.startup_log      0ms     0ms      0ms
local.system.replset      0ms     0ms      0ms
           test.test      0ms     0ms      0ms

数据库命令

数据库命令可以提供比Mongodb自带的监控工具提供更细微的信息,如果上面的方法无法帮你定位到问题所在,你可以试试下面的数据库命令来操作问题的所在。

db.currentOp

db.currentOp()方法可以列出数据中所有正在进行的所有操作,我们可以通过返回的信息中几个比较重要的字段来找出问题所在。

opid: 操作的ID号,可以通过db.killOp()方法来结束进程,就像系统命令中的PID。

active: 表示该操作当前是否还在运行。

secs_running:这个字段非常重要,我们可以根据此字段判断哪个操作进行了阻塞。

op:操作的类型,比如是查询,可能显示的是query。

desc:表示当前操作在日志中的前缀,我们可以根据此前缀在日志中快速定位。

除此之外,我们还可以过滤参数,得到我们只想要的结果,下面是过滤其他不是当前正在查询的操作。

db.currentOp({op: 'query'});

db.serverStatus

db.serverStatus()方法返回数据库状态的一般概述,详细说明磁盘使用情况,内存使用,连接,日记记录和索引访问。

db.stats db.test.stats rs.status

db.stats()方法返回当前数据库的信息,其中objects就代表的是当前数据库所含的所有文档数量。

db.test.stats()方法返回集合的信息

rs.status()返回当前副本集的信息

参考

MongoDB权威指南(第2版)

Mongodb Docs