MongoDB使用profile分析慢查询的步骤

在mongodb中，如果发生了慢查询，我们如何得到这些慢查询的语句，并优化呢？今天来看这块儿的一些心得。

01 如何收集慢查询？

在mongodb中，通常可以开启profile来收集慢日志，查看当前profile状态的语句如下：

				?

									test1:primary> db.getprofilingstatus()

									{

									        "was" : 2,

									        "slowms" : 0,

									        "samplerate" : 1,

									        "$glestats" : {

									                "lastoptime" : timestamp(0, 0),

									                "electionid" : objectid("7fffffff0000000000000005")

									        },

									        "lastcommittedoptime" : timestamp(1619186976, 2),

									        "$configserverstate" : {

									                "optime" : {

									                        "ts" : timestamp(1619186976, 1),

									                        "t" : numberlong(2)

									                }

									        },

									        "$clustertime" : {

									                "clustertime" : timestamp(1619186976, 2),

									                "signature" : {

									                        "hash" : bindata(0,"zvwfpgc0kfxiempj7mbpdrononi="),

									                        "keyid" : numberlong("6904838687771590657")

									                }

									        },

									        "operationtime" : timestamp(1619186976, 2)

									}

这里我们可以看到2个关键参数，分别是was和slowms，其中：

was=0,代表不记录任何的语句；

was=1,代表记录执行时间超过slowms的语句

was=2,代表记录所有的语句

slowms代表语句的阈值，单位是ms

上图中的结果代表我们的实例会收集所有的查询语句。profile收集的查询语句结果存放在admin数据库中的system.profile集合中，可以通过下面的方法进行访问：

				?

									test1:primary> use admin

									switched to db admin

									test1:primary> db.system.profile.find({'op':'query'},{'op':1,'ns':1,'millis':1,'ts':1})

									{ "op" : "query", "ns" : "admin.system.users", "millis" : 0, "ts" : isodate("2020-08-27t07:22:14.815z") }

									{ "op" : "query", "ns" : "admin.system.users", "millis" : 0, "ts" : isodate("2020-08-27t07:22:15.139z") }

									{ "op" : "query", "ns" : "admin.system.users", "millis" : 0, "ts" : isodate("2020-08-27t07:22:15.141z") }

									{ "op" : "query", "ns" : "admin.system.users", "millis" : 0, "ts" : isodate("2020-08-27t07:22:15.239z") }

									{ "op" : "query", "ns" : "admin.system.version", "millis" : 0, "ts" : isodate("2020-08-27t07:22:16.155z") }

									{ "op" : "query", "ns" : "admin.system.version", "millis" : 0, "ts" : isodate("2020-08-27t07:22:16.192z") }

									{ "op" : "query", "ns" : "admin.system.users", "millis" : 0, "ts" : isodate("2020-08-27t07:22:16.225z") }

									{ "op" : "query", "ns" : "admin.system.users", "millis" : 0, "ts" : isodate("2020-08-27t07:22:16.273z") }

									{ "op" : "query", "ns" : "admin.system.version", "millis" : 0, "ts" : isodate("2020-08-27t07:22:16.276z") }

02 system.profile慢查询集合分析

admin数据库中的system.profile是一个固定集合，保存着超过设置的慢查询的结果。我们来看里面的一条慢查询。

利用下面的方法，来拿到一条数据，并对其中的关键字段进行注释说明：

				?

									test1:primary> db.system.profile.findone({'op':'query'})

									{

									        "op" : "query",  # 操作类型

									        "ns" : "admin.system.users",  # 命名空间

									        "command" : {

									                "find" : "system.users",

									                "filter" : {

									                        "_id" : "admin.root"  # 过滤的字段

									                },

									                "limit" : 1,

									                "singlebatch" : true,

									                "lsid" : {

									                        "id" : uuid("a6034f5e-77c1-4b19-9669-60e1253edf4b")

									                },

									                "$readpreference" : {

									                        "mode" : "secondarypreferred"

									                },

									                "$db" : "admin"

									        },

									        "keysexamined" : 1,   # 扫描的索引数

									        "docsexamined" : 1,   # 扫描的行数

									        "cursorexhausted" : true,  

									        "numyield" : 0,

									        "nreturned" : 1,   # 返回的值的行数

									        "locks" : {

									                xxxx   #  锁信息

									        },

									        "flowcontrol" : {

									        },

									        "storage" : {

									        },

									        "responselength" : 647,

									        "protocol" : "op_query",

									        "millis" : 0,    # 这个查询的执行时间，因为我们设置的profilestatus是0，因此所有操作都被记录了。

									        "plansummary" : "idhack",  # 针对_id进行查询

									        "execstats" : {   # 查询执行状态

									                "stage" : "idhack",

									                "nreturned" : 1,

									                "executiontimemillisestimate" : 0,

									                "works" : 2,

									                "advanced" : 1,

									                "needtime" : 0,

									                "needyield" : 0,

									                "savestate" : 0,

									                "restorestate" : 0,

									                "iseof" : 1,

									                "keysexamined" : 1,

									                "docsexamined" : 1

									        },

									        "ts" : isodate("2020-08-27t07:22:14.815z"),

									        "client" : "xx.xx.xx.xx",  # 查询的客户端ip地址

									        "allusers" : [   #  所有的用户信息

									                {

									                        "user" : "root",

									                        "db" : "admin"

									                }

									        ],

									        "user" : "root@admin"   # 使用的用户信息

									}

03 慢查询分析利器---explain

通常情况下，我们可以使用mongodb的explain语法来分析一个语句的查询性能，包含是否用到索引、扫描行数等信息，explain语法的基本用法:

				?

									后置写法

									db.system.profile.find({'op':'query'}).explain()

									前置写法

									db.system.profile.explain().find({'op':'query'})

其中，explain可以放在查询语句的后面或者前面，当然find语法也可以是update、remove、insert

explain语法的输出分为3种不同的详细程度，分别如下：

三种清晰度模式，清晰度越高，则输出的信息越全，默认情况下是queryplanner：

1、queryplanner模式(默认)
db.products.explain().count( { quantity: { $gt: 50 } } )

2、executionstats模式
db.products.explain("executionstats").count( { quantity: { $gt: 50 } } )

3、allplansexecution模式
db.products.explain("allplansexecution").count( { quantity: { $gt: 50 } } )

其中，allplansexecution模式输出的信息最多。

下面是一个explain语法的输出内容，查询的sql如下：

				?

									db.getcollection('files').find(

									{"ctime":{

									           "$gte":isodate("2021-04-18"),

									           "$lt":isodate("2021-04-19")

									       }}).limit(1000).explain("allplansexecution")

输出的结果如下：

				?

									{

									        "queryplanner" : {   # 代表查询的执行计划

									                "plannerversion" : 1,   # 版本号

									                "namespace" : "fs.files",   # 查询的命名空间，也就是集合名称

									                "indexfilterset" : false,   # 是否使用了索引过滤，注意，它并不能判定是否使用了索引

									                "parsedquery" : {    # 查询语法解析树

									                        "$and" : [

									                                {

									                                        "ctime" : {

									                                                "$lt" : isodate("2021-04-19t00:00:00z")

									                                        }

									                                },

									                                {

									                                        "ctime" : {

									                                                "$gte" : isodate("2021-04-18t00:00:00z")

									                                        }

									                                }

									                        ]

									                },

									                "winningplan" : {    # 最终选择的查询计划

									                        "stage" : "limit",   # 查询的阶段，很重要，下面详细介绍

									                        "limitamount" : 1000,   # 查询结果的limit值

									                        "inputstage" : {

									                                "stage" : "fetch",

									                                "inputstage" : {

									                                        "stage" : "ixscan",  # 代表索引扫描

									                                        "keypattern" : {

									                                                "ctime" : 1

									                                        },

									                                        "indexname" : "ctime_1",  #  索引名称

									                                        "ismultikey" : false,    # 下面4个字段都是索引类型分析

									                                        "isunique" : false,

									                                        "issparse" : false,

									                                        "ispartial" : false,

									                                        "indexversion" : 1,

									                                        "direction" : "forward",

									                                        "indexbounds" : {

									                                                "ctime" : [

									                                                        "[new date(1618704000000), new date(1618790400000))"

									                                                ]

									                                        }

									                                }

									                        }

									                },

									                "rejectedplans" : [ ]  # 候选的没被选中的查询计划

									        },

									        "serverinfo" : {

									                "host" : "xxxx",

									                "port" : 24999,

									                "version" : "3.2.8",

									                "gitversion" : "ed70e33130c977bda0024c125b56d159573dbaf0"

									        },

									        "ok" : 1

									}

首先解释下stage的几个阶段：

collscan---全表扫描
ixscan---索引扫描
fetch---根据索引去检索文档
shard_merge---合并分片结果
idhack---针对id进行查询
limit---执行limit

了解了这些stage的阶段之后，我们可以看到，一个查询的过程是一层一层解析的，所以可以看到，stage这个字段有嵌套的情况。winningplan中的执行计划也是按照一层一层的顺序去执行：

1、先执行最内层的索引扫描(ixscan)；

2、再执行外面的fetch，根据索引去拿文档

3、执行最后一步的limit，取指定数目个结果返回给客户端

以上就是mongodb profile分析慢查询的示例的详细内容，更多关于mongodb profile分析慢查询的资料请关注服务器之家其它相关文章！