文件名称:中国News爬虫带数据库.zip
文件大小:46KB
文件格式:ZIP
更新时间:2023-03-28 07:18:52
Python,爬虫,scrapy
采用Python开发语言scrapy网络爬虫框架编写,实现rules规则限定初始链接的爬取区域,xpath语法提取网页数据,可成功运行,希望能为刚开始学习爬虫的人提供参考!
【文件预览】:
OtherNews
----NewsSpider()
--------NewsSpider()
--------scrapy.cfg(263B)
--------test.py(1KB)
--------start.py(81B)
--------.idea()
----.idea()
--------dbnavigator.xml(22KB)
--------codeStyles()
--------misc.xml(188B)
--------News.iml(478B)
--------modules.xml(267B)
--------encodings.xml(138B)
--------workspace.xml(12KB)
----chinanews.sql(52KB)