一种基于情感的中文微博话题检测方法 (2013年)

时间:2024-06-06 19:30:48
【文件属性】:

文件名称:一种基于情感的中文微博话题检测方法 (2013年)

文件大小:1.24MB

文件格式:PDF

更新时间:2024-06-06 19:30:48

工程技术 论文

针对微博这种特殊的文本形式的话题检测,传统的算法并不能取得很好的效果。为了提高其查全率,根据微博这种带有结构化特点的信息,提出了一种带有情感内容加权的话题检测方法。该方法基于含有负面情感的词语往往携带了更多的信息量这一论点,在现有短文本话题检测的算法中,通过加大含有负面情感的短文本在话题检测中的权重,之后再根据一种基于自查询的聚类方法进行话题聚类,将情感倾向融合到短文本话题检测中。在真实数据集上的实验表明,此方法能有效地进行话题聚类并检测话题,并提高了查全率。


网友评论