文件名称:AI Challenger中英双语数据集
文件大小:299.76MB
文件格式:7Z
更新时间:2022-07-06 15:07:11
机器翻译
“AI Challenger全球AI挑战赛”将开放超过1000万条中英文翻译数据、70万个人体动作分析标注数据、30万张图片场景标注和语义描述数据,是国内迄今公开的规模最大的科研数据集。
【文件预览】:
ai_challenger_translation_validation_20170912
----translation_validation_20170912()
--------valid.en-zh.en.sgm(657KB)
--------valid.en-zh.zh.sgm(606KB)
----README(23B)
----COPYRIGHT(3KB)
ai_challenger_translation_train_20170904
----translation_train_data_20170904()
--------train.zh(494.3MB)
--------train.en(530.98MB)
----README(23B)
----COPYRIGHT(3KB)