文件名称:论文研究-基于扩散理论的HITS算法在Web挖掘中的研究与优化.pdf
文件大小:228KB
文件格式:PDF
更新时间:2022-08-11 11:49:13
HITS,网页链接增幅,主题偏离,优先情节,扩散理论
传统的HITS算法单纯地对网页的链接结构进行分析,忽视了页面内容分析和网页的链接增幅,导致了主题偏离和搜索精度不高的问题。针对上述问题进行研究与分析,将超链接信息检索方法与页面内容相结合,根据优先情节和增长定律,提出了一种改进的基于扩散理论的HITS算法。实验结果表明,与传统的HITS和SALSA算法相比,该HITS算法能够有效地限制主题偏离,提高搜索精度,具有较高的实用价值。