文件名称:puppeteer-scraper:操纵木偶的更好的铲运机
文件大小:67KB
文件格式:ZIP
更新时间:2024-05-25 15:15:01
JavaScript
小狗 粗糙的待办事项 当“从内存中”执行时,对于多线程,它确实应该是“现有的承诺” 始终使用module.exports ,不exports 北极星-为保罗而死! 剩下的东西(11月15日) updateUrl.js -1小时 browserPool.js评估-2小时 ...结论,我不需要我自己的browserPool,每个木偶实例都有pages (ala标签) MD5逻辑 DB-将host重命名为domain 进度条 定期更新 添加时间估算 忽略网址中的#哈希 切换回MongoDB,MySQL让我讨厌 Args +连接 安装脚本 重新实现网页图形逻辑 线程管理 遵守--threads参数 暂停/取消暂停 增加/减少线程 hud.progress() 进度-显示开始时间 漂亮一点 hud.message() 写入文件messages.lo
【文件预览】:
puppeteer-scraper-master
----domains()
--------oodavid.com()
--------checkatrade.com()
--------template()
----README.md(7KB)
----.editorconfig(174B)
----.gitignore(2KB)
----app()
--------hud()
--------args()
--------mysql()
--------crawler()
--------mongo()
----UNUSED()
--------crawler.js(1KB)
--------hackernews.js(937B)
--------rig-timing.js(707B)
--------demo-downloaded.js(4KB)
--------CouchDB.js(2KB)
----index.js(891B)
----package-lock.json(63KB)
----package.json(961B)