文件名称:Neural-Machine-Translation:Google Summer of Code 2018项目
文件大小:96KB
文件格式:ZIP
更新时间:2024-05-23 09:18:05
Python
电视新闻的多语言神经机器翻译系统 这是我与一起项目的。 该项目的目的是建立一个多语言神经机器翻译系统,该系统能够将Red Hen Lab的电视新闻字幕从不同的源语言翻译成英语。 该系统在神经编码器-解码器体系结构的顶部使用了强化学习(优势-演员-关键算法),并且优于基于最大对数似然训练的简单神经机器翻译所获得的结果。 我们的系统在标准WMT(机器翻译工作室)测试数据集上取得了近乎最新的结果。 该项目的灵感来自提到的方法。 我已经创建了一个GSoC博客,有关我迄今所取得的进展,请参阅我的所有GSoC博客文章。 博客链接: : 支持以下语言作为源语言,以下是它们的语言代码: 德文-de 法语-fr 俄语-ru 捷克文-CS 西班牙语-es 葡萄牙语-pt 丹麦文-da 瑞典语-SV 中文-zh目标语言是英语。 入门 先决条件 Python-2.7 火炬0.3
【文件预览】:
Neural-Machine-Translation-master
----train.py(11KB)
----scripts()
--------output.py(1KB)
--------tokenizer.perl(17KB)
--------train.sh(2KB)
--------prepare_data.sh(3KB)
--------multi-bleu.perl(5KB)
--------sgm.perl(763B)
--------extract_parallel.py(891B)
--------translate.sh(2KB)
--------parse.py(458B)
--------preprocess.py(1KB)
--------lowercase.perl(285B)
--------strip.py(733B)
----lib()
--------train()
--------__init__.pyc(269B)
--------model()
--------__init__.py(104B)
--------eval()
--------metric()
--------data()
----translate.py(4KB)
----requirements.txt(622B)
----share()
--------nonbreaking_prefixes()
----README.md(7KB)
----subword-nmt()
----preprocess.py(6KB)