文件名称:网页抓取图片的PHP类.zip
文件大小:2KB
文件格式:ZIP
更新时间:2022-07-31 04:11:24
类库下载-网页抓取图片的PHP类
<?php header('Content-Type:text/html;charset=utf-8'); /** * 一个用于抓去图片的类 */ class download_image { public $_save_path = NULL; //图片保存路劲 public $_limit_size = NULL; //图片限制大小 public static $_img_url_old = array(); //存储已抓取过的图片链接地址 public static $_a_page_url = array(); //存储抓取过的页面 public function __construct( $_save_path, $_limit_size) { $this->_save_path = $_save_path; $this->_limit_size = $_limit_size; } public function get_all_page_image( $site_url ) { if ( $site_url == '' ) { return false; } if ( ! in_array( $site_url, self::$_a_page_url ) ) { //判断当前页面是否抓取过 self::$_a_page_url[] = $site_url; //将超链接存入静态数组中 } else { return; //若抓取过则跳出 }1.找到一个页面2.正则过滤所有的img3.正则过滤出所有的src的属性4.获取链接信息,写入文件 file_get_contents(), file_put_contents()5.在cli模式下运行代码(浏览器运行可能内存爆掉,或运行超时)
【文件预览】:
网页抓取图片的PHP类
----php中文网下载站.url(114B)
----php中文网免费下载站.txt(219B)
----tp.php(5KB)