文件名称:php实现整站抓取图片
文件大小:9KB
文件格式:ZIP
更新时间:2016-09-30 13:06:40
图片 爬虫
抓取中小型网站的所有图片,配置文档在config下,domain_name:域名,request_site:网址,request_url:从网站的哪个页面开始,accept_type: 图片类型,save_path:图片保存路径,partition_name:图片保存目录名称前缀,dir_file_limit: 每个目录容许多少个文件,serialize_img_size已读取了多少个图片地址写进到cache目录accompImg文件当中、下次继续爬的时候会忽略这些地址,serialize_url_size:与serialize_url_size一样、已读取多少个地址写进到cache目录overURL文件下
【文件预览】:
easy_capture
----index.php(490B)
----config()
--------capture.site.php(851B)
--------capture.preg.php(950B)
----cache()
--------accompImg(0B)
--------overURL(0B)
----include()
--------pivotal()
--------Capture.class.php(3KB)
--------Capture.const.php(181B)
--------http()
--------file()
----savefiles()
----.settings()
--------com.aptana.editor.php.prefs(48B)
----.project(566B)