文件名称:Python-基于scrapyscrapyredisscrapysplash编写的爬虫
文件大小:26KB
文件格式:ZIP
更新时间:2022-08-30 01:23:17
Python开发-Web爬虫
本项目基于scrapy scrapy-redis scrapy-splash编写的爬取gushiwen.org上面诗词的爬虫,在爬取的过程中将需要解析的链接存入redis,将诗词数据持久化到mysql数据库
【文件预览】:
gushiwen-spider-master
----gushiwen()
--------settings.py(4KB)
--------pipelines.py(4KB)
--------utils.py(1KB)
--------middlewares.py(4KB)
--------__init__.py(0B)
--------items.py(152B)
--------spiders()
--------lua()
----scrapy.cfg(259B)
----LICENSE(34KB)
----README.md(2KB)
----.gitignore(1KB)
----gushiwen.sql(1KB)