文件名称:zxsq:抓取知识星球数据,方便打印学习
文件大小:13KB
文件格式:ZIP
更新时间:2024-06-04 23:25:27
Python
知识星球数据抓取 本工具用于自动连接到已经付费的知识星球,下载所有的文章。 后续可以跟根据需要过滤一些数据,生成Word文档,方便打印学习。 源代码基于Python3.6。需要用的第三方库请自行用pip3下载。 需要安装的包有,reqeusts,pymongo,python-docx 学习理财、财经知识可以到知识星球搜索“老齐的读书圈”和“齐俊杰的粉丝群”,都很不错。代码中就拿这两个星球做为例子。 有疑问请发邮件至 headers.txt 该文件最为关键,用于存放cookies和其它header里的内容,没有正确的cookies自然不能下载数据。 首先在网页中登录知识星球,然后直接从Network中找到对应的Request,再将Request Hearder复制过来就可以。 group.ini 用于记录每个星球上次下载的时间,避免重复下载数据。 Zsxq.ini 用于配置知识星球的各种UR
【文件预览】:
zxsq-master
----EmailHelper.py(3KB)
----DataHandler.py(8KB)
----DocxHelper.py(7KB)
----Mail_Message(20B)
----headers.txt(415B)
----groups.ini(484B)
----Zsxq.py(6KB)
----Zsxq.ini(266B)
----DataSender.py(2KB)
----subscriber_552521181154.txt(14B)
----subscriber_454548818428.txt(14B)
----Config.py(3KB)
----README.md(1KB)
----.gitattributes(66B)