文件名称:爬取简书文章.zip
文件大小:10.12MB
文件格式:ZIP
更新时间:2023-07-29 14:29:57
爬虫 scrapy框架 简书 selenium mysql
使用Scrapy+ Selenium+ChromeDriver爬取简书所有文章,然后存储到mysql数据库中,作为爬虫的练习。当然也可以用这些文章进行数据分析等等。 该压缩包有项目的完整源码和数据库的sql文件。读者可以直接使用。
【文件预览】:
jianshu_spider
----jianshu_spider()
--------spiders()
--------items.py(515B)
--------start.py(75B)
--------pipelines.py(1KB)
--------middlewares.py(1017B)
--------settings.py(3KB)
--------__pycache__()
--------__init__.py(0B)
----scrapy.cfg(271B)
----.idea()
--------.gitignore(184B)
--------workspace.xml(6KB)
--------misc.xml(294B)
--------modules.xml(287B)
--------inspectionProfiles()
--------jianshu_spider.iml(445B)
jianshu.sql