论文研究-基于MFIHC聚类和TOPSIS的微博热点发现方法.pdf

时间:2022-08-11 15:39:14
【文件属性】:

文件名称:论文研究-基于MFIHC聚类和TOPSIS的微博热点发现方法.pdf

文件大小:1.12MB

文件格式:PDF

更新时间:2022-08-11 15:39:14

网络舆情,TOPSIS,热点发现,聚类,微博

针对微博的文本存在短小、快速、变化等特点,导致热点发现困难的问题,提出了一种基于改进的FIHC聚类和TOPSIS的热点发现方法。首先把知网语义相似度引入FIHC聚类算法score函数的计算,考虑了频繁词之间的语义联系,更准确地生成基于频繁词的初始簇;然后对微博文本重复的初始簇进行消减,再采用Single-Pass聚类的思想对消减完的话题簇进一步聚类最终得到热点话题;最后对热点话题采用改进的TOPSIS模型进行排序,更好地获得热点话题的排行。通过与其他文本聚类算法以及热点发现方法对比,该方法热点发现效果好,能够比较全面地反映当前的热点话题。


网友评论