文件名称:scrapy-slideshare:Slideshare抓取脚本
文件大小:6KB
文件格式:ZIP
更新时间:2024-06-01 19:25:24
Python
Scrapy Slideshare
使用python框架进行Slideshare抓取的脚本。
如何使用
克隆此仓库:
git clone https://github.com/brunocascio/scrapy-slideshare && cd scrapy-slideshare
安装依赖项:
chmod +x install.sh && sudo ./install.sh
注意:它仅适用于Debian之类的OS。 仅在Ubuntu 14.04中进行了测试。 请考虑为其他安装贡献此软件包。 有关更多信息,。
运行蜘蛛:D
scrapy crawl SlideShareSpider -a url=
【文件预览】:
scrapy-slideshare-master
----install.sh(154B)
----scrapy.cfg(264B)
----slideshare()
--------settings.py(3KB)
--------pipelines.py(738B)
--------__init__.py(0B)
--------items.py(324B)
--------spiders()
----README.md(692B)
----.gitignore(740B)