文件名称:WebCrawler:用 PhantomJS 和 node.js 实现的网络爬虫
文件大小:2KB
文件格式:ZIP
更新时间:2024-07-19 09:30:39
JavaScript
网络爬虫 使用 PhantomJS 和 node.js 实现的网络爬虫。 爬虫.js 在 PhantomJS 上运行 crawler.js 用于获取渲染的 html 。 分析.js 在 node.js 上运行 analysis.js 用于解析 html 文件。 用途 $ phantomjs crawler.js tagetUrl outputFilePath $ node analysis.js targetHtmlFile 例子 $ phantomjs crawler.js path/to/file.html $ node analysis.js path/to/file.html
【文件预览】:
WebCrawler-master
----node()
--------analysis.js(871B)
----README.md(432B)
----phantomjs()
--------crawler.js(853B)