【文件属性】:
文件名称:spider:node.js中的蜘蛛
文件大小:12KB
文件格式:ZIP
更新时间:2021-05-20 23:18:20
JavaScript
蜘蛛
node.js中的蜘蛛
特征
1可以设置每秒多少个请求
2可以使用扩展继承
安装
npm install xspider
用法
`js
var Spider = require('xspider').Spider,
Crawler = require('xspider').Crawler;
var s = new Spider('http://www.sina.com.cn/'),
参见示例/v2ex.js
原料药
蜘蛛
选项
创建一个带有以下选项的蜘蛛:
var s = new Spider(option)
选项:maxConnections:最大连接并发rps:每秒最大请求,如果小于1,例如0.5,则为每两秒钟的蜘蛛请求。 maxPages:要抓取的最大页面数。
方法:
开始
start(crawler)
开始蜘蛛爬行。 开始之前,您应该设置Spider的搜寻器
【文件预览】:
spider-master
----.gitignore(526B)
----memcache.js(862B)
----package.json(801B)
----redis.js(1KB)
----crawler.js(5KB)
----spider.js(5KB)
----LICENSE(1KB)
----index.js(308B)
----queue.js(5KB)
----utils.js(335B)
----examples()
--------v2ex.js(3KB)
--------sina.js(934B)
----README.md(2KB)
----test()
--------test.js(1KB)