文件名称:大数据ES数据存储,查询之IK中文分词器
文件大小:3.07MB
文件格式:TGZ
更新时间:2021-10-09 09:39:32
es
对于ES IK分词插件在中文检索中非常常用,本人也使用了挺久的。但知识细节一直很碎片化,一直没有做详细的整理。过一段时间用的话,也是依然各种找资料,也因此会降低开发效率。所以在有空的时候好好整理下相关资料。也希望本文对使用 ElasticSearch 和 IK分词插件的开发者有所帮助。希望能少走点弯路。 本文包括前言、IK分词介绍、分词效果对比、自定义词典使用、索引设置和字段设置(Python 创建索引并导入数据)、查询测试(Python 查询)、结论等七个部分。
【文件预览】:
ik
----main.dic(2.92MB)
----surname.dic(752B)
----quantifier.dic(2KB)
----custom()
--------single_word.dic(62KB)
--------single_word_full.dic(62KB)
--------mydict.dic(10B)
--------single_word_low_freq.dic(11KB)
--------ext_stopword.dic(156B)
--------sougou.dic(4.98MB)
----stopword.dic(164B)
----suffix.dic(192B)
----preposition.dic(123B)
----IKAnalyzer.cfg.xml(723B)