Elasticsearch 不同的搜索类型之间的区别

1、match 轻量级搜索

 GET /wymlib/_search

 {

   "query": {

     "match": {

        "title": "王阳明"

     }

   }

 }

上面的查询匹配就会进行分词，比如"王阳明"会被ik分词器分为"王阳明" ,"阳明", "王","阳","明" 那么所有包含这些词中的一个或多个的文档就会被搜索出来。并且根据lucene的评分机制(TF/IDF)来进行评分。

2、match_phrase 短语搜索

 GET   /wymlib/_search

 {

   "query": {

     "match_phrase": {

       "title": "王阳明"

     }

   }

 }

match_phrase要求只匹配上"王阳明"这个短语，完全匹配可能比较严，我们会希望有个可调节因子，少匹配一个也满足，那就需要使用到slop

 {

   "query": {

     "match_phrase": {

         "title" : {

             "query" : "王阳明",

             "slop" : 1

         }

     }

   }

 }

3、multi_match 多字段匹配

如果我们希望两个或两个以上的字段进行匹配，其中一个字段能匹配上就满足的话，使用multi_match

 {

   "query": {

     "multi_match": {

       "query": "王阳明第三卷",

       "fields": [

         "title",

         "keywords",

         "author"

       ]

     }

   }

 }

multi_match中有三种类型即： best_fields 、 most_fields 和 cross_fields （最佳字段、多数字段、跨字段）

1) 我们希望完全匹配的文档占的评分比较高，则需要使用best_fields，multi_match默认是best_fields

 {

   "query": {

     "multi_match": {

       "query": "王阳明",

       "fields": [

         "title",

         "yearAlias"

       ],

       "minimum_should_match": "70%"

     }

   }

 }

2) 我们希望越多字段匹配的文档评分越高，就要使用most_fields

{

  "query": {

    "multi_match": {

      "query": "王阳明",

      "type": "most_fields",

      "fields": [

        "title",

        "keywords"

      ]

    }

  }

}

3) 我们会希望这个词条的分词词汇是分配到不同字段中的，那么就使用cross_fields

 {

   "query": {

     "multi_match": {

       "query": "王阳明",

       "fields": [

         "title",

         "keywords"

       ],

       "type": "cross_fields"

     }

   },

   "highlight": {

     "fields": {

       "title": {

         "pre_tags": ["<a>" ],

         "post_tags": [ "</a>"]

       },

       "keywords": {

         "pre_tags": ["<b>" ],

         "post_tags": ["</b>" ]

       }

     }

   }

 }

上面查询语句中，包含了高亮显示结果属性：highligt

4、term 精确值查找

 {

   "query": {

     "term": {

       "title": "王阳明"

     }

   }

 }

与match查询类似，但term是精确查找，代表完全匹配，即不进行分词器分析，文档中必须包含整个搜索的词汇，但是 term 和 terms 是必须包含（must contain）操作，而不是必须精确相等（must equal exactly），当查询 jack 时，[jack] 和[jack,jone]两条数据都会被找到

秒客网

Elasticsearch 不同的搜索类型之间的区别

相关文章