sodexo_crawler:Nodejs网络爬虫从http获取信息

时间:2024-08-01 19:03:00
【文件属性】:

文件名称:sodexo_crawler:Nodejs网络爬虫从http获取信息

文件大小:5.11MB

文件格式:ZIP

更新时间:2024-08-01 19:03:00

JavaScript

索迪斯卷筒纸刮刀 您必须使用 nodejs 版本 0.10.x 下载依赖项: npm install 安装 MongoDB: sudo apt-get install mongodb 如何调试: node-inspector node --debug-brk crawler.js 然后,转到 如何运行: node crawler.js 如何导出 到 CSV: cd output mongoexport --db sodexo --collection entities --csv --fieldFile entities_fields.txt --out entities.csv 到数据库转储: 生成转储: mongodump -d sodexo -o output 恢复: mongorestore sodexo 有用的 Mongodb 命令: show


【文件预览】:
sodexo_crawler-master
----crawler.js(4KB)
----package.json(394B)
----csvs.zip(5.09MB)
----output()
--------entities_fields.txt(326B)
----LICENSE(18KB)
----mongo.js(5KB)
----.gitignore(587B)
----README.md(1KB)

网友评论