网络爬虫介绍

时间:2015-02-27 06:56:32
【文件属性】:

文件名称:网络爬虫介绍

文件大小:386KB

文件格式:PDF

更新时间:2015-02-27 06:56:32

网络爬虫

聚焦爬虫是一个自动下载网页的程序,它根据既定的抓取目标,有选择的访问万维网上的网页与相关的链接,获取所需要的信息。与通用爬虫(generalpurpose web crawler)不同,聚焦爬虫并不追求大的覆盖,而将目标定为抓取与某一特定主题内容相关的网页,为面向主题的用户查询准备数据资源。


网友评论

  • 部门项目要用,非常感谢