如何部署Scrapy 到Scrapyd上?

时间:2022-08-23 09:41:12

安装上传工具

1、上传工具

scrapyd-client

2、安装方法:

pip install scrapyd-client

3、上传方法:

python d:\Python27\Scripts\scrapyd-deploy target -p project

注:

target -- 主机地址,如localhost;

project -- 工程名,如stock_uc;

4、前提:

①假设python安装位置d:\Python27\;

②需进入工程目录下执行上传命令;

③可选参数:

--version r03,即:

python d:\Python27\Scripts\scrapyd-deploy target -p project --version r03

安装调度工具curl

1、Linux系统

一般情况下Linux系统自带curl工具,如果没有请百度安装方法;

2、Windows系统

1、下载地址:

链接:http://pan.baidu.com/s/1mgy9zVq

密码:4lqh

2、安装方法:

1)解压下载的文件夹,比如解压后的位置E:\bin-curl

2)添加解压后的文件夹路径到环境变量Path中,比如:   D:\Python27\;D:\Python27\Scripts\;E:\bin-curl\;***

3)重启电脑是环境变量生效;

4)测试,运行:curl --help 查看帮助信息;

调度爬虫

1、添加版本信息

curl http://localhost:6800/addversion.json -F project=myproject -F       version=r23 -F egg=@myproject.egg

2、调度spider执行

curl http://localhost:6800/schedule.json -d project=myproject -d    spider=somespider

3、取消spider的执行

curl http://localhost:6800/cancel.json -d project=myproject -d      job=6487ec79947edab326d6db28a2d8651

4、列出工程

curl http://localhost:6800/listprojects.json

5、如何启动scrapyd,以及如何把一个现有的工程部署到scrapyd上面:

第一步:输入scrapyd,敲击enter,等待:

如何部署Scrapy 到Scrapyd上?

第二步:在这个服务器上部署工程,具体方法前面已经提到过

如何部署Scrapy 到Scrapyd上?

第三步:调度spider:

如何部署Scrapy 到Scrapyd上?

第四步:取消

如何部署Scrapy 到Scrapyd上?

第五步:列出工程

如何部署Scrapy 到Scrapyd上?

总结

1,能正确安装scrapyd-client;

2,能够正确安装curl;

3,学会project的上传和spider的调度;

文章来源:麦子学院

原文链接:http://www.maiziedu.com/wiki/crawler/deploy/

如何部署Scrapy 到Scrapyd上?的更多相关文章

  1. 第三百七十二节,Python分布式爬虫打造搜索引擎Scrapy精讲—scrapyd部署scrapy项目

    第三百七十二节,Python分布式爬虫打造搜索引擎Scrapy精讲—scrapyd部署scrapy项目 scrapyd模块是专门用于部署scrapy项目的,可以部署和管理scrapy项目 下载地址:h ...

  2. Scrapyd+Gerapy部署Scrapy爬虫进行可视化管理

    Scrapy是一个流行的爬虫框架,利用Scrapyd,可以将其部署在远程服务端运行,并通过命令对爬虫进行管理,而Gerapy为我们提供了精美的UI,可以在web页面上直接点击操作,管理部署在scrap ...

  3. 五十一 Python分布式爬虫打造搜索引擎Scrapy精讲—scrapyd部署scrapy项目

    scrapyd模块是专门用于部署scrapy项目的,可以部署和管理scrapy项目 下载地址:https://github.com/scrapy/scrapyd 建议安装 pip3 install s ...

  4. scrapy-redis(七):部署scrapy

    一般我们写好scrapy爬虫,如果需要启动的话,需要进入scrapy项目的根目录,然后运行以下命令: scrapy crawl {spidername} 这样我们就可以在终端查看到爬虫信息了.但爬虫运 ...

  5. scrapy与scrapyd安装

    Scrapy是用python编写的爬虫程序. Scrapyd是一个部署与运行scrapy爬虫的应用,提供JSON API的调用方式来部署与控制爬虫 . 本文验证在fedora与centos是安装成功. ...

  6. scrapy——8 scrapyd使用

    scrapy——8    scrapyd使用 什么是scrapyd 怎么安装scrapyd 如何使用scrapyd--运行scrapyd 如何使用scrapyd--配置scrapy.cfg 如何使用s ...

  7. Asp.net web api部署在某些服务器上老是404

    asp.net web api部署在Windows服务器上后,按照WebAPI定义的路由访问,老是出现404,但定义一个静态文件从站点访问,却又OK. 这时,便可以确定是WebAPI路由出了问题,经调 ...

  8. 详细的图文教程来实现 eclipse环境下如何配置tomcat,并且把项目部署到Tomcat服务器上

    很多初学,尤其自学JavaWeb的朋友首次在eclipse下配置tomcat时,总会有种难下手的感觉,在此,通过图文解说的方法,最直观的向大家演示一遍该配置过程. 第一部分:eclipse环境下如何配 ...

  9. Linux系统(将web应用部署到tomcat服务器上)

    一:tomcat服务开机自启动 将启动命令路径配置到/etc/profile文件中在/etc/profile 文件最后配置 /usr/tomcat/apache-tomcat-6.0.45/bin/s ...

随机推荐

  1. 菜鸟学习Spring Web MVC之二

    有文章从结构上详细讲解了Spring Web MVC,我个菜鸟就不引据来讲了.说说强悍的XP环境如何配置运行环境~~ 最后我配好的环境Tomcat.Spring Tool Suites.Maven目前 ...

  2. 【BZOJ】1854: [Scoi2010]游戏

    http://www.lydsy.com/JudgeOnline/problem.php?id=1854 题意:n个数据,每个数据有两个属性,要求取一些数据且每个数据取一个属性使得组成连续的一段单调递 ...

  3. CUBRID学习笔记 35 net驱动错误码和信息 cubrid教程示例

    DO.NET Error Code Number Error Code Error Message Note 0 ER_NO_ERROR "No Error"   1 ER_NOT ...

  4. PLSQL_闪回操作4_Flashback Drop

    2014-06-25 Created By BaoXinjian

  5. [转]IIS部署托管管道模式的集成和经典区别

    关于ESPS和SCSJ在Windows server 2008的问题总结 SCSJ出现的问题在于集成模式和经典模式的选择上,系统本身是没有问题的.我们在部署系统的时候,选择了集成模式,导致WebCon ...

  6. service:jmx:rmi:///jndi/rmi

    service:jmx:rmi:///jndi/rmi://ip:9889/jmxrmi http://*.com/questions/2768087/explain-jmx- ...

  7. 腾讯云安装openvz,高速搭建測试环境

    CSDN送了腾讯云的測试资格,准备拿来作为cici的软件公布首页,想在上面做个demo,无奈没有设备环境,于是想要用openvz来虚拟一些vps: 第一步:选择腾讯云的os模板,centos6.3 第 ...

  8. DevExpress WinForms v18.2新版亮点(三)

    行业领先的.NET界面控件2018年第二次重大更新——DevExpress v18.2日前正式发布,本站将以连载的形式为大家介绍各版本新增内容.本文将介绍了DevExpress WinForms v1 ...

  9. 基元线程同步构造之 Mutes(互斥体)

    互斥体实现了“互相排斥”(mutual exclusion)同步的简单形式(所以名为互斥体(mutex)). 互斥体禁止多个线程同时进入受保护的代码“临界区”(critical section). 因 ...

  10. Kubernetes学习之路(十一)之Pod状态和生命周期管理

    一.什么是Pod? Pod是kubernetes中你可以创建和部署的最小也是最简的单位.一个Pod代表着集群中运行的一个进程. Pod中封装着应用的容器(有的情况下是好几个容器),存储.独立的网络IP ...