前言
之前项目中做Elasticsearch相关开发的时候,虽然借助了第三方的组件PlainElastic.Net,但是由于当时不熟悉用法,而选择了自己拼接查询语句。例如:
string queryGroup = "{\"query\": {\"match\": { \"roomid\": \"FRIEND_12686_10035\" }}}";
//关键字查询
string queryKeyWord = "{ \"query\": {\"match_phrase\": {\"content\": {\"query\": \"" + keyword + "\",\"slop\": 0} } }}";
//是否图片 查询
string queryImg = "{ \"term\": {\"isimg\": true }}";
//是否包含文件查询
string queryFile = "{ \"term\": {\"isfile\": true }}";
//大于小于某个时间段查询
string queryTimeRange = "{\"range\": {\"addtime\": { \"gt\": \"" + st + "\",\"lt\": \"" + et + "\" }} }";
//大于某个时间
string queryTimeRangeGt = "{\"range\": {\"addtime\": { \"gt\": \"" + st + "\"}} }";
//小于某个时间
string queryTimeRangeLt = "{\"range\": {\"addtime\": { \"lt\": \"" + et + "\" }} }";
后来慢慢看了下该组件的源代码,想自己简单实现一下,看看到底是什么原理。
分析
先来一个简单的小例子:PlainElastic中的demo示例:
string query = new QueryBuilder<Tweet>() // This will generate:
.Query(q => q // { "query": { "term": { "User": "somebody" } } }
.Term(t => t
.Field(tweet=> tweet.User).Value("somebody")
)
).Build();
可以看到,构造查询语句的时候很灵活,直接用表达式的形式,最后通过Build方法,生成相应的查询语句,于是乎,照着葫芦画瓢,开始吧。其实,不管如何写语句,最终都是对字符串的拼接,生成最终的查询语句。那我们就从最简单的term查询开始。比如一条查询语句就是 {"query":{"term":{"name":"zhangsan"}}},这条语句的的意思,就是查询 name 为zhangsan的数据。(需要读者懂elasticsearch查询语法)
先不考虑封装,直接新建一个类,就叫 TermFilter,内部实现了 Term 的语言构造。由于需要链式调用,所以里面的方法一般都返回 this 。
private Dictionary<string, object> _terms;
public TermFilter()
{
_terms = new Dictionary<string, object>();
}
public TermFilter KeyValue(string key, object value)
{
_terms.Add(key, value);
return this;
}
如上述代码所示,当我们调用KeyValue方法时,传入key和value,添加到内部的Dictionary中。然后重写 ToString 方法,构造Term语句
private void Build()
{
StringBuilder str = new StringBuilder();
int i = 0;
foreach (KeyValuePair<string, object> kv in _terms)
{
str.Append("{\"term\":{\"" + kv.Key + "\":" + kv.Value + "}}");
if (i >= 0 && i < _terms.Count - 1)
{
str.Append(",");
}
i++;
}
_condition = str.ToString();
}
public override string ToString()
{
Build();
return base.ToString();
}
遍历Dictionary,构造term语句,Term构造完之后,我们需要在外层加一个Query,由于Query是通用的,所以也需要提取出。于是乎,又多了一个类,叫做Filter,这个是查询的入口,里面有两个方法,一个Bool方法,一个Query方法:
public Filter() { }
//
public Filter Bool(Func<BoolFilter, BoolFilter> boolFunc)
{
string boolFuncResult = boolFunc(new BoolFilter()).ToString();
_condition = "{\"query\":{\"filtered\":{\"filter\":{" + boolFuncResult + "}}}";
return this;
}
public Filter Query(Func<BoolFilter, BoolFilter> boolFunc)
{
string boolFuncResult = boolFunc(new BoolFilter()).ToString();
_condition = "{\"query\":" + boolFuncResult;
return this;
}
直接看Query方法,里面的参数为 Func<BoolFilter,BoolFilter> boolFunc,好吧,这里的Boss终于出场了,就是核心类,BoolFilter,它内部实现了,Must,Shoud,MustNot,And,Or,等方法。当然还有Term。我们直接看Term方法。
public BoolFilter Term(Func<TermFilter, TermFilter> termFunc)
{
PrapareCondition();
_condition += termFunc(new TermFilter());
return this;
}
同理,因为链式调用,还是返回this,上述代码中由于termFunc 返回的是一个TermFilter对象,然后toString之后,就相当于追加 相应的Term语句。ToString方法最终也是返回 _condition字段的值。好吧,我猜你越来越晕了,没关系,我们在看最后一个类,就可以实战了。
public QueryCreator Filter(Func<Filter, Filter> filter)
{
_condition += filter(new Filter());
return this;
}
好了,到这里,代码基本结束了。重新梳理一遍:
首先,最外层代码调用Filter方法,Filter实现了Query方法,Query内部传入了BoolFilter参数,在调用Term方法,最终由TermFilter实现语句的构造,所以,外部最终代码调用起来是这样的。
var result = creator.Filter(f => //Filter内部调用Query方法,
f.Query(q => //Query调用BoolFilter的Term方法
q.Term(t => //BoolFilter又调用TermFilter的KeyValue方法
t.KeyValue("name", "zhangsan"))))
.BuildBeautiful();//最后构造出我们想要的结果
如上图,from和size是默认的。下面我们来个稍微复杂点的。比如在一个用户表,想要查询 用户类型为 3 的且地区为 北京 的 并且满足 年龄是 20 岁或者 工作经验为1年 的用户。并且根据 姓名倒叙排序,分页取第3页的20条数据。
首先分析一下,这里我们要使用 and 查询,and 里面还包括 or 查询。 构造语句如下:
var result = creator.Filter(f =>
f.Bool(b => //bool查询
b.Must(m => //must,必须符合条件
m.And(a => //and查询
a.Term(t => //构造查询条件
t.KeyValue("type", 3).KeyValue("area", "北京")).
Or(o => o.Term(t1 => t1.KeyValue("age", 20).KeyValue("experience", 1))))))).//or查询,构造查询条件
Page(3).//页码
Size(20).//每页大小
OrderByDesc("name").//姓名倒叙排序
BuildBeautiful();//根据之前的条件创建查询语句
哈哈,是不是有点绕啊,其实要想用这个,还是得会点ES查询语法的,就好比SQL语句一样,你不理解,是查不出东东的。用这种方式我们就能够避免手动写ES查询语句了,只要经过代码简单配制就好喽,不过我还是乖乖用第三方组件吧,自己写的太渣了。。。
看看构造成的语句:
好了就到这里吧。当做自己研究的总结了。