【文件属性】:
文件名称:node-web-crawler:学习node系列之网络爬虫
文件大小:4KB
文件格式:ZIP
更新时间:2021-04-28 07:24:27
JavaScript
学习使用nodejs完成网络爬虫
用到了以下工具
express
不解释
cheerio
类似于jquery的html文本匹配器
node-readability-cheerio
国人贡献的GB2312及GBK转换为UTF编码库,有效解决中文乱码问题
async
并发控制器
mongoose
便捷的mongodb链接库
promise
优雅的异步解套方案
xss
下次用,转义字符避免xss攻击
【文件预览】:
node-web-crawler-master
----.gitignore(164B)
----package.json(420B)
----index.js(1KB)
----index.html(118B)
----readme.md(354B)
----models.js(249B)
----cheerio.js(2KB)
----.gitattributes(378B)