文件名称:jd_book爬虫.zip
文件大小:107KB
文件格式:ZIP
更新时间:2022-11-03 11:00:56
jd_book爬虫 scrapy xpath
仅用作学习交流用。jd_book爬虫,用scrapy框架,爬取https://book.jd.com/booksort.html大分类全部的书数据。爬取了分类名,分类链接地址,分类下的图书名,图片,作者,出版社,出版时间,SKU(获取JSON用的,包括价格),价格。
【文件预览】:
jd
----log.log(2.05MB)
----scrapy.cfg(247B)
----.idea()
--------jd.iml(398B)
--------misc.xml(226B)
--------workspace.xml(25KB)
--------inspectionProfiles()
--------modules.xml(256B)
----jd()
--------settings.py(3KB)
--------pipelines.py(284B)
--------middlewares.py(4KB)
--------__init__.py(0B)
--------items.py(283B)
--------__pycache__()
--------spiders()