Python-基于scrapyscrapyredisscrapysplash编写的爬虫

时间:2022-08-30 01:23:17
【文件属性】:

文件名称:Python-基于scrapyscrapyredisscrapysplash编写的爬虫

文件大小:26KB

文件格式:ZIP

更新时间:2022-08-30 01:23:17

Python开发-Web爬虫

本项目基于scrapy scrapy-redis scrapy-splash编写的爬取gushiwen.org上面诗词的爬虫,在爬取的过程中将需要解析的链接存入redis,将诗词数据持久化到mysql数据库


【文件预览】:
gushiwen-spider-master
----gushiwen()
--------settings.py(4KB)
--------pipelines.py(4KB)
--------utils.py(1KB)
--------middlewares.py(4KB)
--------__init__.py(0B)
--------items.py(152B)
--------spiders()
--------lua()
----scrapy.cfg(259B)
----LICENSE(34KB)
----README.md(2KB)
----.gitignore(1KB)
----gushiwen.sql(1KB)

网友评论