文件名称:Python-知乎爬虫和v2ex爬虫的实现
文件大小:29KB
文件格式:ZIP
更新时间:2022-08-31 23:06:00
Python开发-Web爬虫
知乎爬虫和v2ex爬虫的实现。使用python的pyspider爬虫进行开发,主要爬取知乎的问题和评论,以及v2ex的帖子。数据转储到mysql数据库,用于zhihu项目的使用。
【文件预览】:
pyspider-master
----conf.json(160B)
----知乎()
--------zhihu.py(3KB)
--------__init__.py(0B)
----v2ex()
--------v2ex.py(3KB)
--------__init__.py(0B)
----.idea()
--------qiushi.iml(431B)
--------misc.xml(185B)
--------encodings.xml(190B)
--------inspectionProfiles()
--------modules.xml(264B)
--------vcs.xml(180B)
----练习()
--------pq.py(1KB)
--------v2ex.html(84KB)
--------mysqldb.py(801B)
--------__init__.py(0B)
--------c3-11.py(6KB)
--------ps1.py(399B)
--------pachong.py(4KB)
----README.md(2KB)
----data()
--------scheduler.1h(6B)
--------result.db(0B)
--------task.db(0B)
--------scheduler.all(6B)
--------scheduler.1d(6B)
--------project.db(12KB)