scrapy-slideshare:Slideshare抓取脚本

时间:2024-06-01 19:25:24
【文件属性】:

文件名称:scrapy-slideshare:Slideshare抓取脚本

文件大小:6KB

文件格式:ZIP

更新时间:2024-06-01 19:25:24

Python

Scrapy Slideshare 使用python框架进行Slideshare抓取的脚本。 如何使用 克隆此仓库: git clone https://github.com/brunocascio/scrapy-slideshare && cd scrapy-slideshare 安装依赖项: chmod +x install.sh && sudo ./install.sh 注意:它仅适用于Debian之类的OS。 仅在Ubuntu 14.04中进行了测试。 请考虑为其他安装贡献此软件包。 有关更多信息,。 运行蜘蛛:D scrapy crawl SlideShareSpider -a url= 图像下载到根目录下的images/文件夹中。


【文件预览】:
scrapy-slideshare-master
----install.sh(154B)
----scrapy.cfg(264B)
----slideshare()
--------settings.py(3KB)
--------pipelines.py(738B)
--------__init__.py(0B)
--------items.py(324B)
--------spiders()
----README.md(692B)
----.gitignore(740B)

网友评论