scraper:刮板模板

时间:2021-06-26 00:36:56
【文件属性】:
文件名称:scraper:刮板模板
文件大小:26KB
文件格式:ZIP
更新时间:2021-06-26 00:36:56
Python 爬虫说明 如果您有任何问题,请联系@Anfernee Chang GTalk: Skype: anfernee-chang 产品数据库架构 您必须仔细阅读 - 我们在 items.py 中定义了产品项目,请按照它。 验证 请运行你的蜘蛛并确保它在发送之前通过scraper/pipelines/validation.py 。 在发送之前,请确保蜘蛛不会因“scrapy crawl spider”而引发任何错误。 任何未经检查就发送的蜘蛛将导致“惩罚”! 笔记 请遵循PEP8风格。 请使用'pasre_product'作为A产品的解析方法,如果可以,请不要传入任何元数据。 请在蜘蛛类变量“xpaths”字典中添加节点的 XPath。 我们将使用这些信息来检查您的蜘蛛。 如果页面没有 XPath 到任何必填字段的数据,请引发 ValueError('XXX!') 。 请使用“
【文件预览】:
scraper-master
----pylintrc(11KB)
----.gitignore(420B)
----requirements.txt(541B)
----.pep8(29B)
----ci.sh(279B)
----scraper()
--------middlewares.py(570B)
--------spiders()
--------__init__.py(0B)
--------utils()
--------pipelines()
--------settings.py(1KB)
--------items.py(3KB)
--------scrapyd_settings_example.py(1KB)
----README.md(2KB)
----scrapy.cfg(244B)
----.env-example(34B)

网友评论