基于主题的DeepWeb聚焦爬虫研究与设计 (2013年)

时间:2024-05-29 03:30:35
【文件属性】:

文件名称:基于主题的DeepWeb聚焦爬虫研究与设计 (2013年)

文件大小:118KB

文件格式:PDF

更新时间:2024-05-29 03:30:35

自然科学 论文

研究如何准确快速获取DeepWeb网络资源.提出了一种基于主题的DeepWeb聚焦爬虫框架,该框架主要包含了爬行模块、网页分类模块、链接解析模块和查询接口判别模块4大模块.实验结果表明,该爬虫的爬行策略取得了很好的效果,大大提高了效率,可以很好地适应特定主题的结构化DeepWeb信息采集.


网友评论