hunspell-builder:使用从单词列表中推断出的前缀和后缀构建 Hunspell 词典

时间:2024-07-06 16:54:35
【文件属性】:

文件名称:hunspell-builder:使用从单词列表中推断出的前缀和后缀构建 Hunspell 词典

文件大小:14KB

文件格式:ZIP

更新时间:2024-07-06 16:54:35

Java

hunspell-builder 版权 版权所有 (c) 2015 基本数据,sro 可以根据 Apache 许可证使用此代码,verzia 2.0 从 2004 年 1 月开始 许可证中的更多信息。 您喜欢使用自然语言处理和编码吗? 为我们工作! Essential Data 适用于语言、大数据和有趣的项目。 查看并在一个了不起的团队中工作! 关于这个项目 我们构建这个项目是为了创建。 我们得到了以下形式的单词列表 lemma form1 tag1 lemma form2 tag2 tag是一个形态标签,在本项目中不使用(可以是任何字符串)。 lemma和form包含特定单词的各种词形( lemma是基本形式)。 当然,我们可以通过简单地列出所有单词来构建一个 hunspell 字典,但这有几个缺点:首先,这个字典会不必要地大(并且在幼稚的 hunspell 实现中速度很慢)。 第


【文件预览】:
hunspell-builder-master
----Makefile(2KB)
----src()
--------main()
----LICENSE(11KB)
----pom.xml(3KB)
----README.md(3KB)

网友评论