文件名称:elasticsearch-analysis-hanlp:用于Elasticsearch的HanLP分析器
文件大小:41.96MB
文件格式:ZIP
更新时间:2024-06-12 12:08:58
Java
elasticsearch-analysis-hanlp HanLP Analyzer for ElasticSearch 此分词器基于,提供了HanLP中大部分的分词方式。 今年一年都在忙其他事,所以插件更新基本一年没有更新,年底更新一波。今年学习了一下ES向量插件(亚马逊设计的那个方式还挺有意思的,重新设计向量索引文件,但文件管理依托于lucene),搞了搞知识图谱(JanusGraph),最近又在弄ES存储计算分离(基于共享存储) :triangular_flag: 更新日志: 适配Elasticsearch 7.5.1~7.10.2版本,更新HanLP版本至1.7.8,更新日志这次就不在每个release上加了,直接看README(7.5.1重新打包订正)(陆续上传中) 修改分词流程,完全采用hankcs提供的hanlp-lucene-plugin进行,详见方法com.hankcs.lucene. Segment
【文件预览】:
elasticsearch-analysis-hanlp-master
----gradlew(6KB)
----settings.gradle(112B)
----LICENSE.txt(11KB)
----src()
--------main()
----NOTICE.txt(0B)
----.travis.yml(34B)
----gradle()
--------wrapper()
----README.md(11KB)
----gradlew.bat(3KB)
----gradle.properties(29B)
----.gitignore(958B)
----build.gradle(3KB)