文件名称:SentiComments.SR:塞尔维亚语中的评论情绪分析数据集
文件大小:396KB
文件格式:ZIP
更新时间:2024-03-15 01:10:06
sentiment-analysis sentiment serbian dataset sentiment-polarity
SentiComments.SR-塞尔维亚语中评论的情感分析数据集 SentiComments.SR数据集包括以下三个语料库: 主要SentiComments.SR语料库,由3490条与电影相关的评论组成。 电影验证语料库,由464个电影相关注释组成。 图书验证语料库,包含173个与图书相关的注释。 数据集创建 主要的SentiComments.SR语料库是根据访客在塞尔维亚的电影评论网站上发表的评论构建。 每个评论都基于其引用的电影以及该电影在评论树中的位置分配了唯一的ID,以表明其在整个讨论中的位置。 包含超过令牌上限(使用基本空白令牌化)的预定义上限的注释将被丢弃,那些注释不是以塞尔维亚语编写的。 电影验证语料库评论来自其他两个塞尔维亚电影评论网站gledajme.rs和 。 图书验证语料库注释也来自网站。 数据集注释 数据集注释中使用了六个情感标签:+ 1,-1,+ M,-
【文件预览】:
SentiComments.SR-master
----SentiComments.SR.verif.movies.txt(52KB)
----experimenter_boe.py(14KB)
----agreement_krippendorff.py(8KB)
----SentiComments.SR.verif.books.txt(17KB)
----ace.py(3KB)
----embedding_vectorizer.py(3KB)
----_config.yml(25B)
----nbsvm.py(2KB)
----experimenter_bow.py(22KB)
----SentiComments.SR.corr.txt(420KB)
----LICENSE.md(444B)
----experimenter_bert.py(7KB)
----README.md(4KB)
----SentiComments.SR.orig.txt(414KB)