文件名称:NeuralMT:使用深度学习的梵语机器翻译
文件大小:47.33MB
文件格式:ZIP
更新时间:2024-06-06 23:50:49
Python
神经MT 梵语机器翻译 梵文的语法非常独特,甚至可以用巴克(Naus)形式(BNF)来表达。 MT的最新进展是使用了Seq2Seq模型进行翻译,该模型由Cho, K., Van Merriënboer, B., Gulcehre, C., Bahdanau, D., Bougares, F., Schwenk, H., & Bengio, Y. (2014). 该项目旨在为梵文创建这样的模型,并添加包含梵文语法的元素。 使用的数据集 需要梵语-英语平行语料库。 找到2个不同的语料库 一个是圣经的梵文翻译,可在获得。 其次是Valmiki Ramayana的英文翻译,为 两者都已预处理成句子列表形式,可以在Data找到 资料夹结构 主要代码可以在Code/keras_end_to_end.py找到 Data/使用了不同的数据集 地位 工作仍在进行中。 将随着任何进展而更新
【文件预览】:
NeuralMT-master
----Sourced Online()
--------utils.py(1KB)
--------data()
--------word2vec_complete.py(5KB)
--------gensim_word2vec.py(7KB)
--------keras_word2vec.py(6KB)
--------get_data.py(4KB)
--------pima-indians-diabetes.csv(23KB)
--------text8.zip(29.89MB)
--------keras_test.py(763B)
--------one(165KB)
----Reports()
--------3-4-18()
----README.md(1001B)
----Code()
--------models.py(458B)
--------word2vec_keras.py(4KB)
--------word2vec_gensim.py(2KB)
--------keras_end_to_end.py(9KB)
----Data()
--------Bible()
--------Ramayana Corpus()
--------fra.txt(10MB)