论文研究-基于预期剩余能量模型的聚焦爬行方法.pdf

时间:2022-10-03 01:34:12
【文件属性】:
文件名称:论文研究-基于预期剩余能量模型的聚焦爬行方法.pdf
文件大小:610KB
文件格式:PDF
更新时间:2022-10-03 01:34:12
论文研究 如何确定搜索的方向和深度是聚焦爬行的核心问题。为此,提出了链接的预期剩余能量概念及其计算方法。该方法利用当前页面的信息计算链接的立即回报能量,利用到达同一链接不同历史路径给予的历史回报知识不断迭代更新链接的预期剩余能量。利用预期剩余能量作为链接的优先级和搜索深度限制,设计了基于预期剩余能量模型的聚焦爬行算法,并给出了关键模块的实现。实验结果显示该方法具有更强的主题网站发现能力。

网友评论