文件名称:网络爬虫实战项目
文件大小:212KB
文件格式:ZIP
更新时间:2022-01-04 09:42:32
爬虫
通用搜索引擎的处理对象是互联网网页,截至目前的网页数量数以百万计,所 以搜索引擎首先面临的问题就是如何能够设计出高效的下载系统,将如此海量 的网页数据传送到本地,在本地形成互联网网页的镜像备份。网络爬虫即扮演 如此角色。它是搜索引擎中及其关键的基础构件。
【文件预览】:
流程图.png
webcrawler.zip
文件名称:网络爬虫实战项目
文件大小:212KB
文件格式:ZIP
更新时间:2022-01-04 09:42:32
爬虫
通用搜索引擎的处理对象是互联网网页,截至目前的网页数量数以百万计,所 以搜索引擎首先面临的问题就是如何能够设计出高效的下载系统,将如此海量 的网页数据传送到本地,在本地形成互联网网页的镜像备份。网络爬虫即扮演 如此角色。它是搜索引擎中及其关键的基础构件。