原文地址:伍仪洲的博客
介绍
为什么要进行监控状态,因为在实际的情况中可能会发生一下无法预计的情况,比如阻塞的问题,阻塞的原因会有很多种情况造成,如果当我们查询文档的时候发生了阻塞,那么就会影响到后面的操作,甚至无法对后面的操作进行响应。
我们可以通过监控很快速的找到到底是哪里出了问题,这样有助于我们快速定位所在的问题,从而得到解决。
Mongodb官方提供了三种用语分析Mongodb的方式:
- Mongodb自带的监控工具:用于提供数据库活动的实时报告
- 数据库命令:以更真实的情况返回数据库状态的统计信息
- 第三方平台托管监控
Mongodb自带监控工具
mongostat
mongostat是官方随同mongodb下载包中一同下载的,你可以找到安装目录或者解压目录进行使用。
我们可以通过mongostat --help()
进行查询可用选项,也可以通过官方文档进行查询。
Mongostat默认所返回的信息都是基于秒为单位,比如返回的insert指的是每秒插入数据库的对象数,而如果我们限制了返回时间,那么这个返回的结果是基于限制时间的平均值。
-O 和 -o
这两个选项功能非常实用,按照正常的情况,Mongostat输出的报告会有很多我们不需要的列,所以我们可以通过-o
来实现,这个选项设置后只会包含我们选择想要列,并且这个选项可以重新命名列的名字,除此之外-o
和-O
还可以添加一些服务器状态到报表中,可以参考ServerStatus。
默认的mongostat输出的内容大概如下,并且每秒钟都会返回一个状态:
insert query update delete getmore command flushes mapped vsize res faults qrw arw net_in net_out conn time
*0 *0 *0 *0 0 2|0 0 0B 2.39G 14.0M 0 0|0 0|0 286b 13.8k 1 Aug 24 17:34:17.615
*0 *0 *0 *0 0 1|0 0 0B 2.39G 14.0M 0 0|0 0|0 285b 13.7k 1 Aug 24 17:34:18.618
*0 *0 *0 *0 0 2|0 0 0B 2.39G 14.0M 0 0|0 0|0 286b 13.8k 1 Aug 24 17:34:19.617
*0 *0 *0 *0 0 1|0 0 0B 2.39G 14.0M 0 0|0 0|0 285b 13.8k 1 Aug 24 17:34:20.617
下面的代码选项是重命名了insert列为cr,并只显示insert,query,update:
$ mongostat --host localhost -o 'insert=cr,query,update'
返回后的文档大概如下:
cr query update
*0 *0 *0
*0 *0 *0
*0 *0 *0
*0 *0 *0
-O
选项除了输出默认的列之外,可以重命名列名,还可以添加ServerStatus一些字段输出到报表,比如插入文档的总数、主机地址、版本号等信息。
$ mongostat --host localhost -O 'insert=cr,host,version'
返回后的文档大概如下:
cr query update delete getmore command flushes mapped vsize res faults qrw arw net_in net_out conn time cr host version
*0 *0 *0 *0 0 2|0 0 0B 2.39G 14.0M 0 0|0 0|0 286b 13.8k 2 Aug 24 17:51:34.031 *0 localhost:27040 3.4.6
*0 *0 *0 *0 0 1|0 0 0B 2.39G 14.0M 0 0|0 0|0 285b 13.8k 2 Aug 24 17:51:35.032 *0 localhost:27040 3.4.6
*0 *0 *0 *0 0 2|0 0 0B 2.39G 14.0M 0 0|0 0|0 286b 13.8k 2 Aug 24 17:51:36.032 *0 localhost:27040 3.4.6
--rowcount
--rowcount
可以控制mongostat返回报表的频率,--rowcount
接受的第一个参数为返回的次数,第二个参数是多少秒生成一次报表并返回。
比如我想每五秒返回一次报表,共返回十次:
$ mongostat --rowcount 10 5
--discover
监控副本集或分片的所有成员的统计信息。
mongotop
mongotop可以监控数据库或者副本集的成员中哪个集合最为繁忙。
$ mongotop --host localhost:27030
返回大概如下内容:
ns total read write 2017-08-25T20:50:06+08:00
admin.system.roles 0ms 0ms 0ms
admin.system.version 0ms 0ms 0ms
local.startup_log 0ms 0ms 0ms
local.system.replset 0ms 0ms 0ms
test.test 0ms 0ms 0ms
数据库命令
数据库命令可以提供比Mongodb自带的监控工具提供更细微的信息,如果上面的方法无法帮你定位到问题所在,你可以试试下面的数据库命令来操作问题的所在。
db.currentOp
db.currentOp()
方法可以列出数据中所有正在进行的所有操作,我们可以通过返回的信息中几个比较重要的字段来找出问题所在。
opid: 操作的ID号,可以通过db.killOp()方法来结束进程,就像系统命令中的PID。
active: 表示该操作当前是否还在运行。
secs_running:这个字段非常重要,我们可以根据此字段判断哪个操作进行了阻塞。
op:操作的类型,比如是查询,可能显示的是query。
desc:表示当前操作在日志中的前缀,我们可以根据此前缀在日志中快速定位。
除此之外,我们还可以过滤参数,得到我们只想要的结果,下面是过滤其他不是当前正在查询的操作。
db.currentOp({op: 'query'});
db.serverStatus
db.serverStatus()
方法返回数据库状态的一般概述,详细说明磁盘使用情况,内存使用,连接,日记记录和索引访问。
db.stats db.test.stats rs.status
db.stats()
方法返回当前数据库的信息,其中objects
就代表的是当前数据库所含的所有文档数量。
db.test.stats()
方法返回集合的信息
rs.status()
返回当前副本集的信息