文件名称:TED 平行语料库数据集
文件大小:365.48MB
文件格式:ZIP
更新时间:2024-07-28 05:49:48
自然语言理解,NLP,机器翻译
TED平行语料库是多语言平行语料库,包括多语言并行语料库和单语语料库。从TED会议www.ted.com 提取109种世界语言。 多语言的平行语料库包括 12 种语言超过1.2亿 个对齐句子并进行了句子对齐。 所有的预处理都是自动完成。
【文件预览】:
TED-Multilingual-Parallel-Corpus-master.zip