yahoo answer scv dataset

时间:2023-12-03 01:59:22
【文件属性】:

文件名称:yahoo answer scv dataset

文件大小:304.68MB

文件格式:GZ

更新时间:2023-12-03 01:59:22

nlp

模型结构很简单,文本输入x,先进行embedding,然后将整句话的每个单词向量计算平均值,最后接fc+softmot进行分类。官方论文中的关键点: 1)不使用预训练word2vec,直接利用标签样本进行学习词嵌入矩阵,也许是因为我们最终要通过对词向量做平均得到句向量,所以不追求单个词向量性能? 2)fc隐层输出可作为句向量,供其他任务使用;


【文件预览】:
yahoo_answers_csv
----classes.txt(183B)
----test.csv(30.56MB)
----train.csv(711.41MB)
----readme.txt(2KB)

网友评论