Scrapyd的安装及使用 - 代码天地

Scrapyd的安装及使用

编程语言 2018-07-20 13:38:41 阅读次数: 0

前言:scarpy是一个爬虫框架, 而scrapyd是一个网页版管理scrapy的工具, scrapy爬虫写好后，可以用命令行运行，但是如果能在网页上操作就比较方便. scrapyd就是为了解决这个问题，能够在网页端查看正在执行的任务，也能新建爬虫任务，和终止爬虫任务，功能比较强大. 还有一个更加强大的国产工具 gerapy!

1.需要进入到你的虚拟环境中安装

scrapyd=1.2.0 scrapyd-client==1.2.0a1 mmh3=2.5.1

pip install scrapyd

pip install scrapyd-client==1.2.0a1

下载后会多个这

下载mmh3可能会遇到的问题

解决方案参考文档http://www.mamicode.com/info-detail-2351094.html

扫描二维码关注公众号，回复： 2266060 查看本文章

解决方法

将上面这两个放到

下面后

同理将上面2个文件放到你的虚拟环境中的site-packages里

出现下图所示即为成功

2.去该地址https://github.com/liyaopinner/BloomFilter_imooc下载py_bloomfilter.py

3.启动scrapyd服务

4.配置爬虫项目

5.开始向scrapyd中部署项目

(1)通过scrapyd-deploy命令测试scrapyd-deploy是否可用。

如果出现下图所示的错误,你需要根据提示的路径找到对应的文件,并修改即可.

如果是下图,则为成功

(2)scrapyd-deploy -l查看当前可用于部署到scrapyd服务中的爬虫有哪些。

参数1： [deploy: jobbole]

参数2： scrapy.cfg文中中的url

(3)命令scrapy list用来查看当前项目中，可用的爬虫。

如果出现下图所示的错误,只需根据提示更改即可

如果是下图,则为成功

(4)列举scrapyd服务中已经部署的爬虫项目：

ScrapydAPI: https://scrapyd.readthedocs.io/en/latest/api.html

如果是下图所示,则为成功

如果出现下图的错误

你需要到Curl下载官网: https://curl.haxx.se/download.html

curl配置说明参考文档:https://www.cnblogs.com/zhuzhenwei918/p/6781314.html

(5)添加版本:

(6)启动一个爬虫(调度爬虫项目)

可以点击Log查看运行情况

(7)取消爬虫运行

猜你喜欢

转载自blog.csdn.net/qq_38661599/article/details/81105910

Scrapyd的安装及使用

scrapyd安装

scrapyd的使用

00006__scrapyd windows环境下安装和使用

scrapyd和scrapyd-client使用教程 scrapyd中文介绍

芝麻HTTP:Scrapyd的安装

scrapyd的安装和部署

Scrapyd API的安装

Scrapyd-Client的安装

Scrapyd的安装与部署

Scrapyd 使用详解

使用scrapyd 部署爬虫

scrapyd使用教程

安装完scrapyd-client后使用scrapyd-deploy时出现无法正常运行的情况的解决

在linux下安装并运行scrapyd 在linux下安装并运行scrapyd

scrapyd

python核心编程：Scrapyd的安装

芝麻HTTP： 1.9.3-Scrapyd-Client的安装

window下scrapyd-client安装的问题

window环境下安装配置scrapyd

scrapyd 爬虫服务的安装与项目部署

[scrapyd] 使用web UI管理爬虫项目

windows中使用scrapyd遇到的问题

使用Scrapyd远程控制爬虫

scrapyd和scrapydweb使用详细教程

windows下安装后scrapyd-client 后，无法启动scrapyd-deploy

Anaconda安装以及scrapy框架和scrapyd的安装

scrapy学习第四篇：windows下安装scrapyd

scrapyd部署、使用Gerapy 分布式爬虫管理框架

win10如何使用scrapyd部署爬虫

今日推荐

周排行

Access的四舍五入取整

8.23 前端学习过程

入门学习过程方向与漏洞复现总结：

操作分布式文件之八：如何批量并行读写远程文件和事务补偿处理

应邀出个教程（搭建tensorflow跑网络环境）

Kubernetes之Pod控制器应用进阶

14-[mysql内置功能]--

HDU6212 区间dp 好题

VS2015生成代码图

验证手机号的工具类

每日归档

更多

2024-10-21(0)

2024-10-20(0)

2024-10-19(0)

2024-10-18(0)

2024-10-17(0)

2024-10-16(0)

2024-10-15(0)

2024-10-14(0)

2024-10-13(0)

2024-10-12(0)