英语语言模型单词预测竞赛数据【Kaggle竞赛】数据集

时间:2024-07-27 21:40:11
【文件属性】:

文件名称:英语语言模型单词预测竞赛数据【Kaggle竞赛】数据集

文件大小:1.58GB

文件格式:ZIP

更新时间:2024-07-27 21:40:11

NLP,自然语言处理

竞赛为自然语言建模任务,是一个Kaggle竞赛,来自Billion word数据集。将英文语料中的每个句子中的一个单词剔除,通过所构建的语言模型对该缺失的单词进行预测。


【文件预览】:
Billion Word Imputation
----train_v2.txt.zip(1.57GB)
----test_v2.txt.zip(16.6MB)

网友评论