Elasticsearch之文档的增删改查以及ik分词器

时间:2022-12-17 20:24:05

文档的增删改查

增加文档

Elasticsearch之文档的增删改查以及ik分词器

Elasticsearch之文档的增删改查以及ik分词器

使用elasticsearch-head查看

Elasticsearch之文档的增删改查以及ik分词器

修改文档

Elasticsearch之文档的增删改查以及ik分词器

Elasticsearch之文档的增删改查以及ik分词器

使用elasticsearch-head查看

Elasticsearch之文档的增删改查以及ik分词器

删除文档

Elasticsearch之文档的增删改查以及ik分词器

使用elasticsearch-head查看

Elasticsearch之文档的增删改查以及ik分词器

查看文档的三种方式

一:根据id查询

Elasticsearch之文档的增删改查以及ik分词器

二:querystring查询

  • query:  需要查询的具体内容
  • default_field:  查询的字段

Elasticsearch之文档的增删改查以及ik分词器

Elasticsearch之文档的增删改查以及ik分词器

注意:将搜索内容"搜索服务器"修改为"钢索",同样也能搜索到文档

原因:default_operator:默认运算符

有AND、OR,默认为OR。比如query里面的内容是”cat dog”,两个短语以空格分开,如果default_operator参数为OR,那么只要字段内包含cat或者dog之一就可以匹配。

如果default_operator为AND,字段内必须同时包含cat和dog才可以匹配。

三:term查询

term是代表完全匹配,即不进行分词器分析,文档中必须包含整个搜索的词汇

Elasticsearch之文档的增删改查以及ik分词器

Elasticsearch之文档的增删改查以及ik分词器

查询结果为零

IK分词器

上面的问题

在进行字符串查询时,我们发现去搜索"搜索服务器"和"钢索"都可以搜索到数据;

而在进行词条查询时,我们搜索"搜索"却没有搜索到数据;

究其原因是ElasticSearch的标准分词器导致的,当我们创建索引时,字段使用的是标准分词

标准分词器的效果

Elasticsearch之文档的增删改查以及ik分词器

而我们需要的分词效果是:我、是、程序、程序员;

这样的话就需要对中文支持良好的分析器的支持,支持中文分词的分词器有很多,word分词器、庖丁解牛、盘分词、Ansj分词等,

但我们常用的还是下面要介绍的IK分词器。
IK分词器简介

IKAnalyzer是一个开源的,基于java语言开发的轻量级的中文分词工具包。从2006年12月推出1.0版开始,IKAnalyzer已经推出 了3个大版本。最初,它是以开源项目Lucene为应用主体的,结合词典分词和文法分析算法的中文分词组件。新版本的IKAnalyzer3.0则发展为 面向Java的公用分词组件,独立于Lucene项目,同时提供了对Lucene的默认优化实现。

IK分词器3.0的特性如下:

1)采用了特有的“正向迭代最细粒度切分算法“,具有60万字/秒的高速处理能力。

2)采用了多子处理器分析模式,支持:英文字母(IP地址、Email、URL)、数字(日期,常用中文数量词,罗马数字,科学计数法),中文词汇(姓名、地名处理)等分词处理。

3)对中英联合支持不是很好,在这方面的处理比较麻烦.需再做一次查询,同时是支持个人词条的优化的词典存储,更小的内存占用。

4)支持用户词典扩展定义。

5)针对Lucene全文检索优化的查询分析器IKQueryParser;采用歧义分析算法优化查询关键字的搜索排列组合,能极大的提高Lucene检索的命中率。

IK分词器的下载

1.地址:https://github.com/medcl/elasticsearch-analysis-ik/releas

2.下载完成之进行解压,将解压的内容放在Elasticsearch的plugins模块中

Elasticsearch之文档的增删改查以及ik分词器

3.重启Elasticsearch,加载IK分词器

Elasticsearch之文档的增删改查以及ik分词器

IK分词器测试

IK提供了两个分词算法ik_smart 和 ik_max_word
其中 ik_smart 为最少切分,ik_max_word为最细粒度划分

ik_smart 为最少切分

请求:http://127.0.0.1:9200/_analyze?analyzer=ik_smart&pretty=true&text=我是程序员

Elasticsearch之文档的增删改查以及ik分词器

ik_max_word为最细粒度划分

请求: http://127.0.0.1:9200/_analyze?analyzer=ik_max_word&pretty=true&text=我是程序员

Elasticsearch之文档的增删改查以及ik分词器

重启查询测试

1.删除原有的在重启创建一份索引,方便测试

创建blog1索引,此时分词器使用ik_max_word

Elasticsearch之文档的增删改查以及ik分词器

2.创建文档和上面的步骤一致

3.使用querystring查询

使用“搜索服务器”进行查询“”

Elasticsearch之文档的增删改查以及ik分词器

效果

Elasticsearch之文档的增删改查以及ik分词器

使用“钢索”进行查询

Elasticsearch之文档的增删改查以及ik分词器

效果

Elasticsearch之文档的增删改查以及ik分词器

4.使用term测试查询

Elasticsearch之文档的增删改查以及ik分词器

Elasticsearch之文档的增删改查以及ik分词器

Elasticsearch之文档的增删改查以及ik分词器的更多相关文章

  1. 分布式搜索elasticsearch 索引文档的增删改查 入门

    1.RESTful接口使用方法 为了方便直观我们使用Head插件提供的接口进行演示,实际上内部调用的RESTful接口. RESTful接口URL的格式: http://localhost:9200/ ...

  2. head插件对elasticsearch 索引文档的增删改查

    1.RESTful接口使用方法 为了方便直观我们使用Head插件提供的接口进行演示,实际上内部调用的RESTful接口.  RESTful接口URL的格式: http://localhost:9200 ...

  3. Elasticsearch 索引文档的增删改查

    利用Elasticsearch-head可以在界面上(http://127.0.0.1:9100/)对索引进行增删改查 1.RESTful接口使用方法 为了方便直观我们使用Head插件提供的接口进行演 ...

  4. Java对XML文档的增删改查

    JAVA增删改查XML文件   最近总是需要进行xml的相关操作. 不免的要进行xml的读取修改等,于是上网搜索,加上自己的小改动,整合了下xml的常用操作. 读取XML配置文件 首先我们需要通过Do ...

  5. mongodb对数组元素及内嵌文档进行增删改查操作(转)

    from:https://my.oschina.net/132722/blog/168274 比如我有一个user类,他包含一个标签属性,这个标签是一个数组,数组里面的元素是内嵌文档,格式如下: &l ...

  6. MongoDB对数组元素及内嵌文档进行增删改查操作

    比如我有一个user类,他包含一个标签属性,这个标签是一个数组,数组里面的元素是内嵌文档,格式如下: {    "_id" : "195861",    &qu ...

  7. Mongodb的基本操作-数据库 集合 文档的增删改查

    数据库操作: //查看有哪些数据库 > show dbs local  0.078GB mydb   0.078GB //use操作将切换到一个数据库 如果数据库存在将直接切换 如果不存在 那么 ...

  8. elasticsearch java和_head插件对索引文档的增删改查

    利用head插件: 1,创建索引并添加一条数据(yananindex:索引名称,yanantype:索引类型,1:索引id) 2.修改索引数据(索引id1不变,_version是对该索引数据执行了几次 ...

  9. mongodb的学习笔记一(集合和文档的增删改查)

    1数据库的增删改查 一.增加一个数据库: use blog-----切换到指定的数据库,如果数据库不存在,则自动创建该数据库(新建的数据库,如果没有存储对应的集合,是不会显示出来的) 二.删除一个数据 ...

随机推荐

  1. No.009:Palindrome Number

    问题: Determine whether an integer is a palindrome. Do this without extra space. 官方难度: Easy 翻译: 不使用额外空 ...

  2. java.lang.NoClassDefFoundError: org/springframework/context/ApplicationContext

    ***************************错误提示************************************************ SEVERE: A child cont ...

  3. 在sql-server上建立mysql链接库

    EXEC sp_addlinkedserver @server = N'RESUME_MYSQL_CONN', @srvproduct=N'MySQL ODBC 5.1 Driver', @provi ...

  4. LINUX下成功搭建SVN

    步骤如下: 1: yum install -y subversion 2:svnserve –version 3: [root@singledb ~]# mkdir /u02/svn [root@si ...

  5. 使用bootstrapvalidator的remote验证经验

    这里需要说一下,bootstrapvalidator的帮助文档写的比较简单,对于remote验证器的说明更是如此,在经历多方测试之后才明白如何使用这个验证器. 一个典型的ajax验证代码如下: 服务端 ...

  6. Android ShellUtils

    Android中执行Shell命令的工具类 public class ShellUtils { public static final String COMMAND_SU = "su&quo ...

  7. C#内存管理解析

    前言:对于很多的C#程序员来说,经常会很少去关注其内存的释放,他们认为C#带有强大的垃圾回收机制,所有不愿意去考虑这方面的事情,其实不尽然,很多时候我们都需要考虑C#内存的管理问题,否则会很容易造成内 ...

  8. 一条语句导致CPU持续100%

    一大早收到一堆CPU预警邮件,通常每天只在统计作业执行期间会收到2~3封CPU预警邮件.这次的预警来自另一台服务器,并且明细数据显示其CPU一直维持在49%.登录到服务器,查看任务管理器(查看资源监视 ...

  9. Docker 创建 Confluence6.12.2 中文版

    目录 目录 1.介绍 1.1.什么是Confluence? 2.Confluence的官网在哪里? 3.如何下载安装? 4.对 Confluence 进行配置 4.1.设置 Confluence 4. ...

  10. MySQL Point in Time Recovery the Right Way

    In this blog, I’ll look at how to do MySQL point in time recovery (PITR) correctly. Sometimes we nee ...