文件名称:elasticsearch-ik分词组件
文件大小:4.29MB
文件格式:ZIP
更新时间:2022-03-20 08:20:29
elasticsearc ik
IK分词器为我们词供了三类词表分别是:1、主词表 main2012.dic 2、量词表quantifier.dic 3、停用词stopword.dic。 Dictionary为字典管理类中,分别加载了这个词典到内存结构中。具体的字典代码,位于org.wltea.analyzer.dic.DictSegment。 这个类实现了一个分词器的一个核心数据结构,即Tire Tree 现在最常用的es分词组件既:ik分词
【文件预览】:
elasticsearch-analysis-ik-5.0.0.jar
plugin-descriptor.properties
config
----main.dic(2.92MB)
----surname.dic(752B)
----custom()
--------single_word_full.dic(62KB)
--------mydict.dic(130B)
--------single_word_low_freq.dic(11KB)
--------ext_stopword.dic(156B)
--------sougou.dic(4.98MB)
--------single_word.dic(62KB)
----stopword.dic(164B)
----quantifier.dic(2KB)
----IKAnalyzer.cfg.xml(697B)
----preposition.dic(123B)
----suffix.dic(192B)
httpclient-4.5.2.jar
commons-logging-1.2.jar
httpcore-4.4.4.jar
commons-codec-1.9.jar