TED 平行语料库数据集

时间:2024-07-28 05:49:48
【文件属性】:

文件名称:TED 平行语料库数据集

文件大小:365.48MB

文件格式:ZIP

更新时间:2024-07-28 05:49:48

自然语言理解,NLP,机器翻译

TED平行语料库是多语言平行语料库,包括多语言并行语料库和单语语料库。从TED会议www.ted.com 提取109种世界语言。 多语言的平行语料库包括 12 种语言超过1.2亿 个对齐句子并进行了句子对齐。 所有的预处理都是自动完成。


【文件预览】:
TED-Multilingual-Parallel-Corpus-master.zip

网友评论