分布式爬虫

时间:2022-01-23 18:54:32
【文件属性】:
文件名称:分布式爬虫
文件大小:10.42MB
文件格式:ZIP
更新时间:2022-01-23 18:54:32
分布式 爬虫 python 1.从一个给定的网址中分析其所包含的 URL 并爬取对应的网页,直到爬取完全部 不重复的网页为止。 2.支持分布式爬取,同时记录输出每一个网页的大小。 3.采用多线程结构设计,实现高性能的网络爬虫。

网友评论