phpcrawler:php爬虫,基于swoole扩展的爬虫,php多进程多线程抓取

时间:2024-06-09 04:41:19
【文件属性】:

文件名称:phpcrawler:php爬虫,基于swoole扩展的爬虫,php多进程多线程抓取

文件大小:31KB

文件格式:ZIP

更新时间:2024-06-09 04:41:19

PHP

PHP多进程/多线程爬虫 1、基于swoole扩展 2、抓取目前可采用curl或者snoopy 3、解析数据目前可使用 dom解析 其余类库会进一步支持 使用说明 1、安装swoole扩展 最新版本即可 sudo pecl install swoole 2、安装redis扩展 sudo apt-get install redis-server 3、配置config/site.php 4、php start_crawl.php 5、php start_parse.php 目前只是基本功能实现,基本都不支持自定义功能。只支持在CLI下运行


【文件预览】:
phpcrawler-master
----client()
--------config()
--------parse()
----icrawler()
--------server()
--------Loader.php(1KB)
--------parse()
--------lib()
--------crawl()
--------helper()
--------Monitor.php(3KB)
----constants.php(368B)
----start_parse.php(183B)
----.gitignore(7B)
----README.md(515B)
----start_crawl.php(214B)

网友评论