spider:node.js中的蜘蛛

时间:2021-05-20 23:18:20
【文件属性】:
文件名称:spider:node.js中的蜘蛛
文件大小:12KB
文件格式:ZIP
更新时间:2021-05-20 23:18:20
JavaScript 蜘蛛 node.js中的蜘蛛 特征 1可以设置每秒多少个请求 2可以使用扩展继承 安装 npm install xspider 用法 `js var Spider = require('xspider').Spider, Crawler = require('xspider').Crawler; var s = new Spider('http://www.sina.com.cn/'), 参见示例/v2ex.js 原料药 蜘蛛 选项 创建一个带有以下选项的蜘蛛: var s = new Spider(option) 选项:maxConnections:最大连接并发rps:每秒最大请求,如果小于1,例如0.5,则为每两秒钟的蜘蛛请求。 maxPages:要抓取的最大页面数。 方法: 开始 start(crawler) 开始蜘蛛爬行。 开始之前,您应该设置Spider的搜寻器
【文件预览】:
spider-master
----.gitignore(526B)
----memcache.js(862B)
----package.json(801B)
----redis.js(1KB)
----crawler.js(5KB)
----spider.js(5KB)
----LICENSE(1KB)
----index.js(308B)
----queue.js(5KB)
----utils.js(335B)
----examples()
--------v2ex.js(3KB)
--------sina.js(934B)
----README.md(2KB)
----test()
--------test.js(1KB)

网友评论