elasticsearch-analysis-decompound:用于Elasticsearch的分解插件

时间:2024-05-27 17:41:29
【文件属性】:

文件名称:elasticsearch-analysis-decompound:用于Elasticsearch的分解插件

文件大小:1.7MB

文件格式:ZIP

更新时间:2024-05-27 17:41:29

Java

用于Elasticsearch的Decompound插件 这是的word decompounder插件的实现。 将多个单词合成为一个单词并不是所有语言都具有的特性。 复合用于德语,斯堪的纳维亚语,芬兰语和韩语。 这段代码是对基础的实现,该可在莱比锡大学的 ,Automatische Sprachverarbeitung的中找到。 Lucene带有两个复合词标记过滤器,一个字典和一个基于连字的变体。 两者都有一个缺点,它们需要在运行之前在内存中加载单词列表。 这种反编译不需要单词列表,它可以开箱即用地处理德语文本。 该反编译器使用预先构建的Compact Patricia Tries进行自动分词,由ASV工具箱提供。 表1.表兼容性矩阵 插件版本 Elasticsearch版本 发布日期 5.4.3.0 5.4.3 2017年8月24日 5.4.0.0 5.4.0


【文件预览】:
elasticsearch-analysis-decompound-master
----.travis.yml(86B)
----gradlew.bat(2KB)
----gradlew(5KB)
----config()
--------checkstyle()
----gradle.properties(192B)
----gradle()
--------wrapper()
--------sonarqube.gradle(864B)
--------publish.gradle(2KB)
--------ext.gradle(608B)
----src()
--------test()
--------main()
----.gitignore(106B)
----README.adoc(8KB)
----LICENSE.txt(15KB)
----build.gradle(4KB)

网友评论