基于多Agent系统的定题爬虫算法 (2008年)

时间:2024-06-10 22:33:59
【文件属性】:

文件名称:基于多Agent系统的定题爬虫算法 (2008年)

文件大小:269KB

文件格式:PDF

更新时间:2024-06-10 22:33:59

工程技术 论文

定题爬虫的研究是定题搜索引擎的关键技术。该文提出一种基于多Agent系统的爬虫算法,采用本题语义主题关键词过滤的方法来抓取与主题相关的网页,利用本体库语义网络实现本体领域中同近义词的过滤。凭借HTML网页标记对关键字识别的不同权重和超链接锚文本对主题相关网页进行预测,通过黑板的通信机制实现多Agent交互。实验结果表明算法在抓取网页的查准率、查全率方面有一定的改善。


网友评论