以bank account 数据为例，认识elasticsearch query 和 filter

Elasticsearch 查询语言（Query DSL）认识(一)

一、基本认识

查询子句的行为取决于

query context
filter context

也就是执行的是查询（query）还是过滤(filter)

query context 描述的是：被搜索的文档和查询子句的匹配程度
filter context 描述的是： 被搜索的文档和查询子句是否匹配

一个是匹配程度问题，一个是是否匹配的问题

二、实例

导入数据 bank account data download
将数据导入到elasticsearch

curl -XPOST 'localhost:9200/bank/account/_bulk?pretty' --data-binary "@accounts.json"

curl 'localhost:9200/_cat/indices?v'

这里有两个地方需要注意，1.host要改成符合自己的。2.早期版本中下载的数据可以能是'accounts.json?raw=true'

大概如下 curl -XPOST 'wbelk:9200/bank/account/_bulk?pretty' --data-binary "@accounts.json?raw=true"

参数认识

为了便捷操作，可以安装一个kiabna sense

$./bin/kibana plugin --install elastic/sense

$./bin/kibana

sudo -i service restart kibana(或者用这个启动kibana)

以bank account 数据为例，认识elasticsearch query 和 filter

match_all 搜索，直接返回所有文档

GET /bank/_search

{

  "query": {

    "match_all": {}

  }

}

返回大致如下：

{

  "took": 1,

  "timed_out": false,

  "_shards": {

    "total": 5,

    "successful": 5,

    "failed": 0

  },

  "hits": {

    "total": 1000,

    "max_score": 1,

    "hits": [

      {

        "_index": "bank",

        "_type": "account",

        "_id": "25",

        "_score": 1,

        "_source": {

          "account_number": 25,

          "balance": 40540,

          "firstname": "Virginia",

          "lastname": "Ayala",

          "age": 39,

          "gender": "F",

          "address": "171 Putnam Avenue",

          "employer": "Filodyne",

          "email": "virginiaayala@filodyne.com",

          "city": "Nicholson",

          "state": "PA"

        }

      },

参数大致解释：

took: 执行搜索耗时，毫秒为单位，也就是本文我1ms
time_out: 搜索是否超时
_shards: 多少分片被搜索，成功多少，失败多少
hits：搜索结果展示
hits.total: 匹配条件的文档总数
hits.hits: 返回结果展示，默认返回十个
hits.max_score：最大匹配得分
hits._score: 返回文档的匹配得分（得分越高，匹配程度越高，越靠前）
_index _type _id 作为剥层定位到特定的文档
_source 文档源

查询语言之 执行查询

只显示account_number 和 balance

POST /bank/_search

{

  "query": { "match_all": {} },

  "_source": ["account_number", "balance"]

}

{

  "took": 2,

  "timed_out": false,

  "_shards": {

    "total": 5,

    "successful": 5,

    "failed": 0

  },

  "hits": {

    "total": 1000,

    "max_score": 1,

    "hits": [

      {

        "_index": "bank",

        "_type": "account",

        "_id": "25",

        "_score": 1,

        "_source": {

          "account_number": 25,

          "balance": 40540

        }

      },

      {

        "_index": "bank",

        "_type": "account",

        "_id": "44",

        "_score": 1,

        "_source": {

          "account_number": 44,

          "balance": 34487

        }

      },

      {

        "_index": "bank",

        "_type": "account",

        "_id": "99",

        "_score": 1,

        "_source": {

          "account_number": 99,

          "balance": 47159

        }

      },

返回accountu_number 为20的document

POST /bank/_search

{

  "query": { "match": { "account_number": 20 } }

}

{

  "took": 4,

  "timed_out": false,

  "_shards": {

    "total": 5,

    "successful": 5,

    "failed": 0

  },

  "hits": {

    "total": 1,

    "max_score": 5.6587105,

    "hits": [

      {

        "_index": "bank",

        "_type": "account",

        "_id": "20",

        "_score": 5.6587105,

        "_source": {

          "account_number": 20,

          "balance": 16418,

          "firstname": "Elinor",

          "lastname": "Ratliff",

          "age": 36,

          "gender": "M",

          "address": "282 Kings Place",

          "employer": "Scentric",

          "email": "elinorratliff@scentric.com",

          "city": "Ribera",

          "state": "WA"

        }

      }

    ]

  }

}

返回地址中包含(term)mill的所有账户

POST /bank/_search

{

  "query": { "match": { "address": "mill" } }

}

返回地址中包含term 'mill'或者 'lane'的所有账户

POST /bank/_search

{

  "query": { "match": { "address": "mill lane" } }

}

匹配phrase 'mill lane'

POST /bank/_search

{

  "query": { "match_phrase": { "address": "mill lane" } }

}

返回address包含'mill'和'lane'的所有账户 (AND)

POST /bank/_search

{

  "query": {

    "bool": {

      "must": [

        { "match": { "address": "mill" } },

        { "match": { "address": "lane" } }

      ]

    }

  }

}

返回address包含'mill'或'lane'的所有账户 (OR)

POST /bank/_search

{

  "query": {

    "bool": {

      "should": [

        { "match": { "address": "mill" } },

        { "match": { "address": "lane" } }

      ]

    }

  }

}

返回address既不包含'mill'也不包含'lane'的所有账户 (NO)

POST /bank/_search

{

  "query": {

    "bool": {

      "must_not": [

        { "match": { "address": "mill" } },

        { "match": { "address": "lane" } }

      ]

    }

  }

}

返回age为40，并且state不是ID的所有账户（组合）

POST /bank/_search

{

  "query": {

    "bool": {

      "must": [

        { "match": { "age": "40" } }

      ],

      "must_not": [

        { "match": { "state": "ID" } }

      ]

    }

  }

}

查询语言之 执行过滤

过滤不会进行相关度得分的计算

在所有账户中寻找balance 在29900到30000之间（闭区间）的所有账户

（先查询到所有的账户，然后进行过滤）

POST /bank/_search

{

  "query": {

    "filtered": {

      "query": { "match_all": {} },

      "filter": {

        "range": {

          "balance": {

            "gte": 29900,

            "lte": 30000

          }

        }

      }

    }

  }

}

{

  "took": 1,

  "timed_out": false,

  "_shards": {

    "total": 5,

    "successful": 5,

    "failed": 0

  },

  "hits": {

    "total": 5,

    "max_score": 1,

    "hits": [

      {

        "_index": "bank",

        "_type": "account",

        "_id": "243",

        "_score": 1,

        "_source": {

          "account_number": 243,

          "balance": 29902,

          "firstname": "Evangelina",

          "lastname": "Perez",

          "age": 20,

          "gender": "M",

          "address": "787 Joval Court",

          "employer": "Keengen",

          "email": "evangelinaperez@keengen.com",

          "city": "Mulberry",

          "state": "SD"

        }

      },

      {

        "_index": "bank",

        "_type": "account",

        "_id": "781",

        "_score": 1,

        "_source": {

          "account_number": 781,

          "balance": 29961,

          "firstname": "Sanford",

          "lastname": "Mullen",

          "age": 26,

          "gender": "F",

          "address": "879 Dover Street",

          "employer": "Zanity",

          "email": "sanfordmullen@zanity.com",

          "city": "Martinez",

          "state": "TX"

        }

      },

      ...

根据返回结果我们可以看到filter得到的_score为1.不存在程度上的问题。是0和1的问题

三、query和filter效率

一般认为filter的速度快于query的速度

filter不会计算相关度得分，效率高
filter的结果可以缓存到内存中，方便再用

以bank account 数据为例，认识elasticsearch query 和 filter的更多相关文章

ElasticSearch - query vs filter
query vs filter 来自* * - queries-vs-filters Question 题主希望知道Query和Filter的区别 An ...
elasticsearch query 和 filter 的区别
Query查询器与 Filter 过滤器尽管我们之前已经涉及了查询DSL,然而实际上存在两种DSL:查询DSL(query DSL)和过滤DSL(filter DSL).过滤器(filter)通常 ...
Elasticsearch query和filter的区别
1.关于Query context和filter context 查询语句的表现行为取决于使用了查询上下文方式还是过滤上下文方式. Query context:查询上下文,回答了“文档是如何被查询语句 ...
数据从文件导入Elasticsearch
1.资源准备 1.数据文件:accounts.json 2.索引名称:bank 3.数据类型:account 4.批量操作API:bulk 2.导入数据 curl -XPOST 'localhost: ...
[Codeforces Round &num;186 (Div&period; 2)] A&period; Ilya and Bank Account
A. Ilya and Bank Account time limit per test 2 seconds memory limit per test 256 megabytes input sta ...
php curl模拟post请求提交数据样例总结
在php中要模拟post请求数据提交我们会使用到curl函数,以下我来给大家举几个curl模拟post请求提交数据样例有须要的朋友可參考參考.注意:curl函数在php中默认是不被支持的,假设须要使用 ...
How To Change the Supplier Bank Account Masking in UI (Doc ID 877074&period;1)
Give Feedback... How To Change the Supplier Bank Account Masking in UI (Doc ID 877074.1) ...
Pandas之&colon;Pandas高级教程以铁达尼号真实数据为例
Pandas之:Pandas高级教程以铁达尼号真实数据为例目录简介读写文件 DF的选择选择列数据选择行数据同时选择行和列使用plots作图使用现有的列创建新的列进行统计 DF重组简 ...
Query DSL for elasticsearch Query
Query DSL Query DSL (资料来自: http://www.elasticsearch.cn/guide/reference/query-dsl/) http://elasticsea ...

随机推荐

JavaScript之web通信
web通信,一个特别大的topic,涉及面也是很广的.因最近学习了 javascript 中一些 web 通信知识,在这里总结下.文中应该会有理解错误或者表述不清晰的地方,还望斧正! 一.前言 1. ...
动态给textView加图片
Drawable img = layout.getResources().getDrawable(R.drawable.icon); // 调用setCompoundDrawables时,必须调用Dr ...
CentOS 6/7安装ffmpeg
环境 CentOS 6/7 安装导入GPG key rpm --import http://packages.atrpms.net/RPM-GPG-KEY.atrpms 安装ATRPMS Repo ...
Dispose() C&num; 优化内存
public void Dispose() { ((IDisposable)_designer).Dispose(); } #region IDisposable Support private bo ...
python日常-int和float
首先先看看下面的代码
Windows 64位安装Oracle instantclient 官方绿色版和PL/SQL Developer 总结
原文: http://blog.csdn.net/kimsoft/article/details/8751267 操作系统:Windows 7 64位旗舰要求,安装PL/SQL Developer用 ...
sql中count(&ast;)和count(字段名)区别
数据测试:见图 sql 语句见分晓: SELECT COUNT(*) c1 ,COUNT(ADDRESS) c2 FROM test 显而易见,count(*)统计的是结果集的总条数,count(字段 ...
spoj 346
当一个数大于等于12 那分别处以2, 3, 4之后的和一定大于本身但是直接递归会超时然后发现有人用map存了膜拜..... #include <cstdio> #i ...
团队作业8——第二次项目冲刺（Beta阶段）博客汇总
一.冲刺计划安排 http://www.cnblogs.com/teamworkers/p/6875742.html 二.七天冲刺汇总 http://www.cnblogs.com/teamworke ...
Chrome插件触发web页面的事件
Chrome插件中不能直接调用Web页面的元素js,原因是chrome插件的机制http://*.com/questions/17819344/triggering-a-cli ...