文件名称:nodejs:原生nodejs+ES6实现爬虫
文件大小:12KB
文件格式:ZIP
更新时间:2024-06-07 07:58:19
JavaScript
原生node和jsdom实现爬虫 项目介绍 使用node原生模块+jsdom/cheerio模块,实现http和https通用的爬虫工具 目录不定时更新爬成功的网站 目录libs是封装好的请求方法 软件架构 原生node模块: 1、http模块 2、https模块 3、fs模块 4、path模块 5、assert模块 6、url模块 第三方模块 jsdom cheerio 第三方模块 5、jsdom模块-解析dom结构 安装教程 npm i安装模块 使用说明 node xxx.js文件 最简单的爬虫 1、引入http模块 const http=require('http'); 2、通过http模块的request方法,请求网络地址 let req=http.request('http://www.baidu.com', res=>{}); 其中res=>{}是请求成功后的回调函数,req用
【文件预览】:
nodejs-master
----spider4.js(76B)
----real()
--------ipoicc.js(4KB)
--------README.md(155B)
----spider.js(810B)
----spider2.js(1KB)
----spider3.js(2KB)
----README.md(9KB)
----libs()
--------request.js(2KB)
----spider6.js(1KB)
----data()
--------animation.sql(2KB)
----jsdom.js(362B)
----.gitignore(18B)
----package.json(501B)
----spider5.js(276B)