文件名称:SOCC:SFU意见和评论语料库
文件大小:4.19MB
文件格式:ZIP
更新时间:2024-04-28 01:00:12
sentiment opinions negation toxicity appraisal
SOCC SFU意见和评论语料库 SFU意见和评论语料库(SOCC)是用于分析在线新闻评论的语料库。 我们的语料库包含评论和产生评论的文章。 这些文章都是观点文章,不是硬新闻。 该语料库比任何其他当前可用的注释语料库要大,并且已被收集来注意保留答复结构和其他元数据。 除了原始语料库,我们还为四种不同现象提供注释:建设性,毒性,否定及其范围和评估。 有关这项工作的更多信息,请参见我们的论文。 Kolhatkar,V.,H。 Wu,L。Cavasso,E。Francis,K.Shukla和M.Taboada(2020) 。 语料库实用语4(2),155-190。 科哈特卡。 V. and M. Taboada(2017)。 ,自然语言处理的经验方法会议相遇。 哥本哈根2017年9月。 Kolhatkar,V. and M. Taboada(2017)。 计算语言学协会第55届年会。
【文件预览】:
SOCC-master
----guidelines()
--------WebAnno_instructions.pdf(620KB)
--------Appraisal_annotation_guidelines.pdf(1.91MB)
--------Constructivess_Toxicity_CrowdFlower_instructions.pdf(814KB)
--------Negation_annotation_guidelines.pdf(1.04MB)
----scripts()
--------combine_webanno.py(3KB)
--------rename_webanno.py(4KB)
--------readme(2KB)
--------clean_comments.py(3KB)
--------visualization_notebooks()
--------old_combine_comments.py(42KB)
--------appraisal_analysis.R(54KB)
--------webanno_to_sentence.py(43KB)
--------socc_comment_profilling.py(7KB)
--------projects_to_tsv.py(16KB)
--------webanno_to_span.py(42KB)
--------commenter_stats()
----LICENSE(162B)
----README.md(15KB)