文件名称:elasticsearch-analysis-hao:一个非常hao用的elasticsearch(es)中文分词器插件
文件大小:8.72MB
文件格式:ZIP
更新时间:2024-04-10 23:20:25
elasticsearch hanlp analysis-hao hao-elasticsearch Java
HAO ES分词器 简介 如何开发一个ES分词插件请参考 主要参考了和其中有的源码是直接搬运的,例如把HanLP的DijkstraSegment抄写过来了,同时做了一些优化。 特性 支持复杂汉字,有的汉字在java中长度不是1 ,例如
【文件预览】:
elasticsearch-analysis-hao-main
----README.md(7KB)
----pom.xml(7KB)
----src()
--------test()
--------main()
----config()
--------HaoAnalyzer.cfg.xml(960B)
--------base_dictionary.json(7.57MB)
--------custom_dictionary.txt(19B)
----LICENSE.txt(11KB)
----data()
--------hanlp.properties(2KB)
--------hanlp-data()