UnsupervisedMT:基于短语和神经的无监督机器翻译

时间:2024-03-17 02:25:15
【文件属性】:

文件名称:UnsupervisedMT:基于短语和神经的无监督机器翻译

文件大小:266KB

文件格式:ZIP

更新时间:2024-03-17 02:25:15

Python

无监督机器翻译 该存储库包含以下示例中提供的无监督PBSMT和NMT模型的原始实现: (EMNLP 2018)。 注意:对于NMT方法,我们建议您看一下和相关的GitHub存储库 ,其中包含更好的模型和更有效的无监督机器翻译实现。 NMT实现支持: 三种机器翻译架构(seq2seq,biLSTM +注意,Transformer) 能够跨模型/语言共享任意数量的参数 去噪自动编码器培训 并行数据训练 反向并行数据训练 动态多线程生成反向并行数据 以及原始论文中未使用的其他功能(留作以后的工作): 培训期间任意语言 语言模型预训练/共享参数共同训练 对抗训练 PBSMT实现支持: 无监督短语表生成脚本 摩西自动化培训 依存关系 Python 3 (当前在版本0.5上进行测试) (干净并标记化文本/训练PBSMT模型) (生成并应用BPE代码) (生成嵌入) (生成跨


【文件预览】:
UnsupervisedMT-master
----LICENSE(19KB)
----CONTRIBUTING.md(572B)
----NMT()
--------main.py(19KB)
--------src()
--------preprocess.py(1KB)
--------get_data_deen.sh(10KB)
--------get_data_enfr.sh(10KB)
----.gitignore(1KB)
----CODE_OF_CONDUCT.md(244B)
----PBSMT()
--------src()
--------create-phrase-table.py(5KB)
--------run.sh(13KB)
----README.md(15KB)
----illustration.png(179KB)

网友评论