【文件属性】:
文件名称:scraper:刮板模板
文件大小:26KB
文件格式:ZIP
更新时间:2021-06-26 00:36:56
Python
爬虫说明
如果您有任何问题,请联系@Anfernee Chang
GTalk:
Skype: anfernee-chang
产品数据库架构
您必须仔细阅读 -
我们在 items.py 中定义了产品项目,请按照它。
验证
请运行你的蜘蛛并确保它在发送之前通过scraper/pipelines/validation.py 。
在发送之前,请确保蜘蛛不会因“scrapy crawl spider”而引发任何错误。
任何未经检查就发送的蜘蛛将导致“惩罚”!
笔记
请遵循PEP8风格。
请使用'pasre_product'作为A产品的解析方法,如果可以,请不要传入任何元数据。
请在蜘蛛类变量“xpaths”字典中添加节点的 XPath。 我们将使用这些信息来检查您的蜘蛛。
如果页面没有 XPath 到任何必填字段的数据,请引发 ValueError('XXX!') 。
请使用“
【文件预览】:
scraper-master
----pylintrc(11KB)
----.gitignore(420B)
----requirements.txt(541B)
----.pep8(29B)
----ci.sh(279B)
----scraper()
--------middlewares.py(570B)
--------spiders()
--------__init__.py(0B)
--------utils()
--------pipelines()
--------settings.py(1KB)
--------items.py(3KB)
--------scrapyd_settings_example.py(1KB)
----README.md(2KB)
----scrapy.cfg(244B)
----.env-example(34B)