elasticsearch-analysis-hao:一个非常hao用的elasticsearch(es)中文分词器插件

时间:2024-04-10 23:20:25
【文件属性】:

文件名称:elasticsearch-analysis-hao:一个非常hao用的elasticsearch(es)中文分词器插件

文件大小:8.72MB

文件格式:ZIP

更新时间:2024-04-10 23:20:25

elasticsearch hanlp analysis-hao hao-elasticsearch Java

HAO ES分词器 简介 如何开发一个ES分词插件请参考 主要参考了和其中有的源码是直接搬运的,例如把HanLP的DijkstraSegment抄写过来了,同时做了一些优化。 特性 支持复杂汉字,有的汉字在java中长度不是1 ,例如


【文件预览】:
elasticsearch-analysis-hao-main
----README.md(7KB)
----pom.xml(7KB)
----src()
--------test()
--------main()
----config()
--------HaoAnalyzer.cfg.xml(960B)
--------base_dictionary.json(7.57MB)
--------custom_dictionary.txt(19B)
----LICENSE.txt(11KB)
----data()
--------hanlp.properties(2KB)
--------hanlp-data()

网友评论