文件名称:英语语言模型单词预测竞赛数据【Kaggle竞赛】数据集
文件大小:1.58GB
文件格式:ZIP
更新时间:2024-07-27 21:40:11
NLP,自然语言处理
竞赛为自然语言建模任务,是一个Kaggle竞赛,来自Billion word数据集。将英文语料中的每个句子中的一个单词剔除,通过所构建的语言模型对该缺失的单词进行预测。
【文件预览】:
Billion Word Imputation
----train_v2.txt.zip(1.57GB)
----test_v2.txt.zip(16.6MB)