scrapy项目部署_1 - 代码天地

scrapy项目部署_1

其他 2018-05-28 16:41:45 阅读次数: 7

什么是scrapyd

Scrapyd是部署和运行Scrapy.spider的应用程序。它使您能够使用JSON API部署（上传）您的项目并控制其spider。

特点：

可以避免爬虫源码被看到。
有版本控制。
3、可以远程启动、停止、删除

scrapyd官方文档：http://scrapyd.readthedocs.io/en/stable/overview.html

安装scrapyd

安装scrapyd

主要有两种安装方式：
pip install scrapyd （安装的版本可能不是最新版本）
从 https://github.com/scrapy/scrapyd 中下载源码，运行python setup.py install 命令进行安装。

安装 scrapyd-deploy

主要有两种安装方式：
pip install scrapyd-client（安装的版本可能不是最新版本）
从 http://github.com/scrapy/scrapyd-client 中下源码，运行python setup.py install 命令进行安装。

scrapyd的简单使用

1.运行scrapyd

运行命令：scrapyd

然后打开浏览器，输入ip加端口：127.0.0.1:6800（或localhost：6800）

2.发布项目到scrapyd

来到待发布项目的文件夹下，发布前需要修改一下配置文件，打开scrapy.cfg文件；

首先去掉url前面的注释符号，url是scrapyd服务器的网址
然后project=tenCent为项目名称，可以随意起名
修改[deploy]为[deploy:100]，表示把爬虫发布到名为100的爬虫服务器上，一般在需要同时发布爬虫到多个目标服务器时使用

最后，打开一个新的终端，运行命令：

scrapyd-deploy <target> -p <project>  --version <version>

　　参数解释：

Target：deploy后面的名称。可以为空

Project：自行定义名称，跟爬虫的工程名字无关。

Version：自定义版本号，不写的话默认为当前时间戳。

刷新浏览器页面：

3.创建运行爬虫任务

使用命令：

curl http://localhost:6800/schedule.json -d project=myproject -d spider=spider_name

　然后点击浏览器界面的Jobs

就可以得到该爬虫的相关运行信息。

猜你喜欢

转载自www.cnblogs.com/pythoner6833/p/9100783.html

scrapy项目部署_1

django项目部署1

maven的配置和项目部署（1）

Django (十) 项目部署 1

Angular前端项目部署教程---1

项目部署-Django项目部署

maven 项目部署

项目部署随记

项目部署安装

web 项目部署

php项目部署

jboss项目部署

项目部署步骤

JavaWeb项目部署

项目部署的步骤

项目部署随笔

SpringBoot项目部署

mac 项目部署

linux项目部署

项目部署总结

tomcat项目部署

项目部署基础

vue 项目部署

爬虫项目部署

前端项目部署

Django 项目部署

项目部署的步骤_

项目部署

Angular项目部署

Laravel项目部署

今日推荐

周排行

深度学习------Lingvo框架下的加速通道GPipe

webjars管理静态资源

C专家编程_2.2

mysql 源码安装

json文件操作

123231432

注解的实现

Spring MVC 控制器

《人月神话》读后感二

C#使用HttpWebRequest和HttpWebResponse上传文件示例

每日归档

更多

2024-09-08(0)

2024-09-07(0)

2024-09-06(0)

2024-09-05(0)

2024-09-04(0)

2024-09-03(0)

2024-09-02(0)

2024-09-01(0)

2024-08-31(0)

2024-08-30(0)