文件名称:yahoo answer scv dataset
文件大小:304.68MB
文件格式:GZ
更新时间:2023-12-03 01:59:22
nlp
模型结构很简单,文本输入x,先进行embedding,然后将整句话的每个单词向量计算平均值,最后接fc+softmot进行分类。官方论文中的关键点: 1)不使用预训练word2vec,直接利用标签样本进行学习词嵌入矩阵,也许是因为我们最终要通过对词向量做平均得到句向量,所以不追求单个词向量性能? 2)fc隐层输出可作为句向量,供其他任务使用;
【文件预览】:
yahoo_answers_csv
----classes.txt(183B)
----test.csv(30.56MB)
----train.csv(711.41MB)
----readme.txt(2KB)