phpcrawler:php爬虫,基于swoole扩展的爬虫,php多进程多线程抓取

时间:2021-05-20 10:54:39
【文件属性】:
文件名称:phpcrawler:php爬虫,基于swoole扩展的爬虫,php多进程多线程抓取
文件大小:31KB
文件格式:ZIP
更新时间:2021-05-20 10:54:39
PHP PHP多进程/多线程爬虫 1、基于swoole扩展 2、抓取目前可采用curl或者snoopy 3、解析数据目前可使用 dom解析 其余类库会进一步支持 使用说明 1、安装swoole扩展 最新版本即可 sudo pecl install swoole 2、安装redis扩展 sudo apt-get install redis-server 3、配置config/site.php 4、php start_crawl.php 5、php start_parse.php 目前只是基本功能实现,基本都不支持自定义功能。只支持在CLI下运行
【文件预览】:
phpcrawler-master
----client()
--------config()
--------parse()
----icrawler()
--------server()
--------Loader.php(1KB)
--------parse()
--------lib()
--------crawl()
--------helper()
--------Monitor.php(3KB)
----constants.php(368B)
----start_parse.php(183B)
----.gitignore(7B)
----README.md(515B)
----start_crawl.php(214B)

网友评论