Scrapy框架学习第二天

时间:2021-06-08 20:28:53

编写scrapy爬虫的具体流程
最初:分析网站页面需要爬取的结构
第一步:创建scrapy项目:scrapy startproject +文件名
第二步:打开项目
第三步:编写items.py
第四步:创建爬虫文件(基础爬虫文件创建指令:scrapy genspider + 爬虫名 +"网站名")
第五步:编写文件
第六步:编写管道文件(piplines.py)
第七步:修改setting.py文件(设置爬虫文件必须的功能)

小知识点:linux中 tree是树形结构显示文件结构