文件名称:word源码java-jwordsplitter:用于拆分德语复合词的小型Java库
文件大小:266KB
文件格式:ZIP
更新时间:2024-06-25 16:15:58
系统开源
word源码java jWordSplitter 4.4-快照 版权所有 2004-2007 Sven Abels 版权所有 2007-2018 Daniel Naber 源代码在 Apache 许可下许可,版本 2.0(见下文) 这个 Java 库可以将德语复合词拆分成更小的部分。 例如“Erhebungsfehler”将被拆分为“Erhebung”和“fehler”。 这对德语单词特别有用,但它可以用于所有语言,只要提供了字典和扩展AbstractWordSplitter的类。 到目前为止,仅支持德语,并且 JAR 中包含德语词典。 尽管它适用于某些形容词(例如“knallgelb”-> knall + gelb)和动词(例如“zurückrudern”-> zurück + rudern),但它最适合名词。 该库的替代品可能是 或DictionaryCompoundWordTokenFilter 。 您可能也对此感兴趣。 来自 Java 的用法 使用此依赖项或: < dependency > < groupId >de.danielnaber</ groupId > < arti
【文件预览】:
jwordsplitter-master
----.gitignore(126B)
----src()
--------main()
--------test()
----README-internal.md(489B)
----LICENSE.txt(12KB)
----pom.xml(6KB)
----README.md(5KB)
----CHANGES.md(4KB)
----build.sh(760B)