文件名称:node-tarantula:用于 nodejs 的网络爬虫
文件大小:15KB
文件格式:ZIP
更新时间:2024-07-24 01:14:38
JavaScript
节狼蛛 nodejs crawler/spider,它提供了一个简单的接口来爬取网络。 它的 API 受到了启发。 快速示例 var brain = { legs : 8 , shouldVisit : function ( uri ) { return true ; } } ; var tarantula = new Tarantula ( brain ) ; tarantula . on ( 'data' , function ( uri ) { console . info ( '200' , uri ) ; } ) ; tarantula . on ( 'done' , function ( ) { console . log ( 'done' ) ; } ) ; tarantula . start ( [ "http:/
【文件预览】:
node-tarantula-master
----example-wikidive-phantom.js(935B)
----.jshintrc(239B)
----.gitignore(12B)
----package.json(989B)
----LICENSE(1KB)
----useragents.json(2KB)
----example-wikidive.js(850B)
----THANKS(230B)
----README.md(848B)
----lib()
--------client()
--------UserAgents.json(2KB)
--------tarantula.js(10KB)
--------ResourcePool.js(2KB)