文件名称:可配置和可扩展PHP网络蜘蛛-PHP开发
文件大小:186KB
文件格式:ZIP
更新时间:2024-06-16 01:38:32
PHP HTTP
PHP-Spider功能支持两种遍历算法:广度优先和深度优先支持爬网深度限制,队列大小限制和最大下载限制,支持添加自定义URI发现逻辑。 depth-first支持爬网深度限制,队列大小限制和最大下载限制,支持基于XPath,CSS选择器或普通的旧PHP附带的自定义URI发现逻辑,其中包含一组有用的URI过滤器,例如Domain限制支持自定义URI过滤器,预提取(URI)和后提取(资源内容)均支持自定义请求处理逻辑,并带有一组有用的持久性处理程序(内存,