文件名称:机器翻译:OSPMADRD 20的回购:机器翻译中的独立研究
文件大小:218.3MB
文件格式:ZIP
更新时间:2024-03-06 05:22:22
Python
机器翻译 在本季度的项目中,我试图复制“描述的方法。 如果要在计算机上尝试,请使用git clone https://github.com/dharakyu/Machine-Translation克隆到计算机上。 确保您已安装依赖项(NLTK和PyTorch应该涵盖了所有内容)并运行python phrase_based_model.py 。 我建议在云实例上运行它。 关于此存储库的组织方式: tutorials文件夹包含PyTorch NLP教程中的代码,而project文件夹包含我项目中的源代码。 在project有一个data文件夹,其中包含一些不同的数据集。 dev.en和dev.es是来自机器翻译分配的小型并行英语-西班牙语数据集,用于翻译器的短语匹配部分。 en_unligned和es_unaligned是用于训练的单语语料库。 它们是来自大量样本。 文件夹en和es