文件名称:nepali-translator:尼泊尔-英语对上的神经机器翻译
文件大小:3.24MB
文件格式:ZIP
更新时间:2024-05-29 17:21:46
machine-translation data-cleaning parallel-corpus nepali-english Python
尼泊尔翻译 尼泊尔-英语对上的神经机器翻译(NMT)。 该项目的贡献:添加并清除了公开可用的并行数据,并改善了该对受监督MT的基线分数。 有关此项目的报告可。 我们准备的并行数据可以在找到。 data_cleaning目录包含实现报告中讨论的清理方法的脚本。 translator目录具有translator的工作界面。 更新 迈向2019年一些额外的工作是在该项目下进行的结束,描述 。 本文中报告的模型可以在 找到。 我还将很快添加一个指向较大语料库的链接。 截至2021年2月,模型文件与软件包的最新版本之间存在一些兼容性问题。 要解决这些问题,请使用以下版本的软件包: torch-1.3.0 fairseq-0.9.0 portalocker-2.0.0 sacrebleu-1.4.14 sacremoses-0.0.43 sentencepiece-0.1.91 。 结果
【文件预览】:
nepali-translator-master
----LICENSE(11KB)
----data_cleaning()
--------functions.py(4KB)
--------no_repeat_parallel_data.py(1KB)
--------KDEGNOME.py(768B)
--------nnc_mono.py(335B)
--------ted.py(384B)
--------rmv.py(164B)
--------sentensify.py(360B)
--------TMX_XML.py(621B)
--------bad_parallel_fixes.py(922B)
--------sandbox.py(904B)
--------xml_to_text.py(267B)
----README.md(7KB)
----translator()
--------runtime.txt(12B)
--------Procfile(28B)
--------app()
--------requirements.txt(48B)
--------README.md(0B)
----consolidate.py(446B)