文件名称:wechat_spider:nodejs+anyproxy appium+python 自动化抓取微信公众号文章
文件大小:14.96MB
文件格式:ZIP
更新时间:2024-05-31 16:24:14
JavaScript
声明: 此项目nodejs微信爬虫原地址为 本人在此基础: bug: 修复循环爬取公众号死循环 替换正文的正则更新 new: 加入appium和python脚本, 利用redis作为通信设施, 达到python操作手机脚本 和 原nodejs 程序通信配合, 让整个爬虫全自动化运行 ps: 本人不是很懂nodejs,原作者的bug,新加的功能都是很简单的代码,重点是实现思路,如果有问题或者bug,欢迎指正 ------以下为原作者readme------ wechat_spider 微信爬虫 基于Node 的微信爬虫,通过中间人代理的原理,批量获取微信文章数据,包括阅读量、点赞量和评论等数据。 使用代理模块AnyProxy。代码已支持AnyProxy 4版本。 开始 安装前准备 安装Node,版本大于 8.8.1 安装MongoDB,版本大于 3.4.6 安装Redis 安装Node 全局