文件名称:基于主题的DeepWeb聚焦爬虫研究与设计 (2013年)
文件大小:118KB
文件格式:PDF
更新时间:2024-05-29 03:30:35
自然科学 论文
研究如何准确快速获取DeepWeb网络资源.提出了一种基于主题的DeepWeb聚焦爬虫框架,该框架主要包含了爬行模块、网页分类模块、链接解析模块和查询接口判别模块4大模块.实验结果表明,该爬虫的爬行策略取得了很好的效果,大大提高了效率,可以很好地适应特定主题的结构化DeepWeb信息采集.
文件名称:基于主题的DeepWeb聚焦爬虫研究与设计 (2013年)
文件大小:118KB
文件格式:PDF
更新时间:2024-05-29 03:30:35
自然科学 论文
研究如何准确快速获取DeepWeb网络资源.提出了一种基于主题的DeepWeb聚焦爬虫框架,该框架主要包含了爬行模块、网页分类模块、链接解析模块和查询接口判别模块4大模块.实验结果表明,该爬虫的爬行策略取得了很好的效果,大大提高了效率,可以很好地适应特定主题的结构化DeepWeb信息采集.