European_Parliament_Proceedings_Parallel_Corpus_1996-2011.torrent

时间:2023-07-11 09:58:46
【文件属性】:
文件名称:European_Parliament_Proceedings_Parallel_Corpus_1996-2011.torrent
文件大小:39KB
文件格式:TORRENT
更新时间:2023-07-11 09:58:46
机器翻译语料库 European Parliament Proceedings Parallel Corpus 1996-2011 数据集是一个用于统计 机器翻译 的语料库,其中 Europarl 平行语料库来源于欧洲议会的程序,它包括 21 种欧洲语言版本: 罗马语(法语,意大利语,西班牙语,葡萄牙语,罗马尼亚语) 日耳曼语(英语,荷兰语,德语,丹麦语,瑞典语) Slavik(保加利亚语,捷克语,波兰语,斯洛伐克语,斯洛文尼亚语) Finni-Ugric(芬兰语,匈牙利语,爱沙尼亚语) 波罗的海语(拉脱维亚语,立陶宛语) 希腊语 European Parliament Proceedings Parallel Corpus 1996-2011 数据集最初由苏格兰爱丁堡大学信息学院于 2005 年发布,主要发布人为 Philipp Koehn。 该数据集于 2012 年发布第 7 版,相关论文有《Europarl: A Parallel Corpus for Statistical Machine Translation》

网友评论