文件名称:CrawlerGenerator:木偶履带发电机
文件大小:11.18MB
文件格式:ZIP
更新时间:2024-06-14 11:15:18
electron nodejs puppeteer JavaScript
jsdom 因为我不喜欢Python(现在感觉Python还挺香的:face_with_tears_of_joy:),而且js操作dom效率应该更高一点吧。。。。毕竟爬自己人。。。所以我最开始选择用nodejs来写爬虫,有一个包叫 挺好用的。请求网页,然后丢jsdom里面就可以使用它来获取网页上的元素。 const jsdom = require("jsdom"); const { JSDOM } = jsdom; const dom = new JSDOM(`<!DOCTYPE html>
Hello world
`); console.log(dom.window.document.querySelector("p").textContent); 简单易用 不过遇到一些渐进式的网页,或者spa就比较剌蛋了。。。会比较麻烦,所以 就是一个很好的选择。 什么是Puppeteer? Puppeteer 是一个 Node 库【文件预览】:
CrawlerGenerator-main
----src()
--------main.js(2KB)
--------server.js(680B)
--------menu.js(4KB)
--------scriptManager.js(2KB)
--------rotate.js(2KB)
----scripts()
--------generator.js(2KB)
--------selector.js(4KB)
--------inspector.js(831B)
--------codeSnip.js(2KB)
----wwwroot()
--------view()
--------js()
--------css()
----assets()
--------icon.png(273KB)
--------assets.zip(11.35MB)
----README.md(11KB)
----.gitignore(26B)
----package-lock.json(5KB)
----package.json(932B)