IK Analysis for Elasticsearch:一个将Lucene IK分析器集成到elasticsearch中的插件-开源

时间:2024-06-24 20:00:03
【文件属性】:

文件名称:IK Analysis for Elasticsearch:一个将Lucene IK分析器集成到elasticsearch中的插件-开源

文件大小:4.3MB

文件格式:ZIP

更新时间:2024-06-24 20:00:03

开源软件

IK Analyzer是一款基于java语言开发的开源、轻量级的中文分词工具包。 自 2006 年 12 月发布 1.0 版以来,IKAnalyzer 已经推出了 4 个主要版本。 最初是一个基于开源项目 Luence 为主要应用,结合词典分词和语法分析算法的中文分词组件。 从3.0版本开始,IK已经发展成为Java通用的分词组件,独立于Lucene项目,同时提供了Lucene的默认优化实现。 在 2012 版本中,IK 实现了简单的分词歧义消除算法,标志着 IK tokenizer 从纯字典分词到模拟语义分词的演进。


【文件预览】:
plugin-descriptor.properties
httpclient-4.5.2.jar
commons-codec-1.9.jar
plugin-security.policy
commons-logging-1.2.jar
config
----surname.dic(752B)
----main.dic(2.92MB)
----preposition.dic(123B)
----stopword.dic(164B)
----extra_single_word_full.dic(62KB)
----suffix.dic(192B)
----extra_single_word.dic(62KB)
----extra_single_word_low_freq.dic(11KB)
----extra_main.dic(4.98MB)
----IKAnalyzer.cfg.xml(625B)
----quantifier.dic(2KB)
----extra_stopword.dic(156B)
httpcore-4.4.4.jar
elasticsearch-analysis-ik-7.13.1.jar

网友评论