Docker python3.7+Scrapy1.5+Scrapyd+Scrapyd-client部署爬虫踩坑记 - 代码天地

Docker python3.7+Scrapy1.5+Scrapyd+Scrapyd-client部署爬虫踩坑记

其他 2020-03-28 00:48:17 阅读次数: 0

基于python3.7在docker hub上的官方镜像

在基于debain的官方python3.7的镜像用dockerfile安装了scrapy、scrapyd、scrapyd-client。

1. ...in from_crawler spider = cls(*args, **kwargs) TypeError: __init__() got an unexpected keyword argument '_job'

在win用pycharm运行正常，在容器中直接用scrapy命令行运行正常，用scrapyd 调度执行就报错。

原因：我自己在每一个spider中复写了 __init__ 方法，并且参数跟 scrapy/spider/__init__.py的参数不同。

解决办法：参数改成和父类__init__ 一样的，并且删除scrapyd多传的_job 参数，然后重新部署。

def __init__(self, name=None, **kwargs):
        kwargs.pop('_job', None)
        super().__init__(name, **kwargs)

2. 爬虫一旦有修改，必须用scrapyd-client 发布新版本。

3. 发布： scrapy-deploy 主机名 -p 项目名 --version 数字（可以小数）

例子项目配置文件scrapy.cfg如下：

[settings]
default = pro.settings

[deploy:name] 
url = http://192.168.0.111:6800/
project = suibian

发布：

scrapyd-deploy name -p lalala --version 1

最终在 http://localhost：6800 看到的项目名称就是 lalala， scrapyd-deploy后面的name 对应配置文件里面的 [deploy:name] 这个在统一服务器上部署多爬虫的时候有用，用docker的话，一个容器就部署一个。

扫描二维码关注公众号，回复： 10233880 查看本文章

pendant59

发布了87 篇原创文章 · 获赞 58 · 访问量 17万+

私信关注

猜你喜欢

转载自blog.csdn.net/benpaodelulu_guajian/article/details/86485148

Docker python3.7+Scrapy1.5+Scrapyd+Scrapyd-client部署爬虫踩坑记

scrapyd spiderkeeper docker部署

scrapy部署scrapyd+scrapydweb+nginx设置密码+docker scrapydweb

Python3网络爬虫实战-12、部署相关库的安装：Docker、Scrapyd

Scrapyd部署Scrapy爬虫

构建Scrapyd的Docker镜像

Python核心编程：Scrapyd 对接 Docker汇总

docker踩坑记

2018 Scrapy Environment Enhance(4)Docker Service for Scrapyd and Tor Network

scrapy爬虫docker部署

docker中创建scrapyd 镜像

转载——docker踩坑记

Scrapy爬虫以及Scrapyd爬虫部署

Jumpserver docker部署及踩坑

Scrapyd 在Linux下简单部署Scrapy爬虫

Scrapy爬虫笔记(scrapy、scrapy-redis、scrapyd部署scrapy)

scrapyd 部署scrapy项目

scrapyd部署scrapy项目

scrapyd，scrapy部署

Docker踩坑记（持续更新中）

docker 部署ui for docker

【docker】docker部署tomcat

【docker】docker部署mysql

【docker】docker部署nginx

Scrapyd部署爬虫

基于Scrapyd的爬虫部署

scrapyd部署爬虫项目

scrapyd 部署爬虫项目

Scrapyd部署爬虫文件

爬虫部署scrapyd

今日推荐

周排行

四大线程池详解

如何高效使用Vim

Mogodb的常用操作总结

Spyder默认页面布局调整

SAR日志分析

OAuth是一个关于授权（authorization）的开放网络标准，在全世界得到广泛应用，目前的版本是2.0版。本文对OAuth 2.0的设计思路和运行流程，做一个简明通俗的解释，主要参考材料为R

WebService中注解开发，CXF，Spring整合，Rest风格

2019考研英语一 Text1分析

windows下安装docker详细步骤

CentOS 7/6系统升级内核版本到5.2.2

每日归档

更多

2024-08-05(0)

2024-08-04(0)

2024-08-03(0)

2024-08-02(0)

2024-08-01(0)

2024-07-31(0)

2024-07-30(0)

2024-07-29(0)

2024-07-28(0)

2024-07-27(0)