论文研究-基于LSA和结构特性的微博话题检测.pdf

时间:2022-08-11 11:47:09
【文件属性】:

文件名称:论文研究-基于LSA和结构特性的微博话题检测.pdf

文件大小:975KB

文件格式:PDF

更新时间:2022-08-11 11:47:09

微博,话题检测,文本聚类,语义空间,潜在语义分析

针对传统的话题检测方法在处理大规模微博短文本时出现的降维能力不足和语义信息丢失等问题,提出基于潜在语义分析和结构特性相结合的微博话题检测方法。根据微博的对话属性和传播模型,首先要合并微博讨论树扩展微博文本,创建基于潜在语义分析(LSA)的微博文本模型以解决数据稀疏性问题,最后结合时间信息给出新的相似度计算方法,并采用凝聚层次聚类法检测微博话题。实验结果表明,提出的方法降低了话题检测的错失率,大大提高了微博话题检测的性能。


网友评论