文件名称:sarcasm_wsd:嵌入单词以预测单词的字面意思或讽刺意味(EMNLP 2015)
文件大小:40.47MB
文件格式:ZIP
更新时间:2024-05-20 09:00:57
Java
嵌入单词以预测单词的字面意思或讽刺意味 这些数据文件包含ID以及tweet的目标,如论文“ Sarcastic or not:预测单词的字面意义或讽刺意义的字嵌入”中所述。 第一列代表目标,第二列代表推文的ID。 文件名说明了文件的用途。 例如,“ tweet.SARCASM.all.id.TRAIN”包含针对本文中使用的所有目标(37个目标)的讽刺训练数据,其中“ tweet.SENTIMENT.all.id.TEST”和“ tweet.NON_SARCASM.all “ .id.TEST”分别包含情感测试数据和随机测试数据。 如果您使用此数据撰写研究论文,请引用以下论文。 讽刺与否:预言词的字面含义或讽刺意味的词嵌入。 Debanjan Ghosh,郭为伟,Smaranda Muresan。 在EMNLP会议录中,2015年,葡萄牙里斯本。 如果遇到任何问题,请联系Debanj
【文件预览】:
sarcasm_wsd-master
----README.md(1KB)
----WordEmbedding.java(12KB)
----tweet.all.11282016.sg.model.bin(38.06MB)
----SimWithWE.java(5KB)
----data()
--------tweet.NON_SARCASM.all.id.TEST(482KB)
--------tweet.SARCASM.all.id.TEST(482KB)
--------tweet.SENTIMENT.all.id.TRAIN(3.76MB)
--------tweet.SENTIMENT.all.id.TEST(482KB)
--------tweet.SENTIMENT.all.id.DEV(481KB)
--------tweet.NON_SARCASM.all.id.DEV(481KB)
--------tweet.SARCASM.all.id.TRAIN(3.76MB)
--------tweet.NON_SARCASM.all.id.TRAIN(3.76MB)
--------tweet.SARCASM.all.id.DEV(481KB)