文件名称:wordlist-generator:生成适用于IME词典的单词列表XML文件
文件大小:38KB
文件格式:ZIP
更新时间:2024-05-25 18:59:12
Python
词表生成器 生成适用于IME词典的单词列表XML文件。 目标是使用Wikipedia作为语料库,生成用于Firefox OS键盘的稀有语言的词典文件。 XML格式取自使用的一种。 安装 克隆或分叉此仓库,然后执行以下操作: $ npm install 用法 $ node bin/generate xx 其中xx是目标语言的语言代码。 见所有可用语言的列表。 您可以在config/settings.json更改临时目录。 去做 *以外的可插入语料库 使用,满足所有NLP需求 单元测试 笔记 仅在Linux机器上的威尔士语(cy)和拉丁语(la)上测试了此项目。
【文件预览】:
wordlist-generator-master
----.gitignore(563B)
----README.md(999B)
----bin()
--------generate(113B)
--------WikiExtractor.py(86KB)
----package.json(786B)
----src()
--------generate_wordlist.js(3KB)
--------lib()
----config()
--------settings.json(24B)