Scrapy Settings级别 & 如何获取settings & 一些可能用到的setting - 代码天地

Scrapy Settings级别 & 如何获取settings & 一些可能用到的setting

其他 2018-10-31 17:23:34 阅读次数: 0

http://doc.scrapy.org/en/1.0/topics/settings.html

一、有5种类型的Settings，优先级由高到低

1. 命令行选项

使用-s复写设置，如scrapy crawl myspider -s LOG_FILE=scrapy.log

2. 每个spider的setting

scrapy.spiders.Spider.custom_settings属性设置

3. 项目的setting

myproject.settings，项目下的settings文件

4. 每个命令的默认setting

5. 默认setting

二、获取settings值

经常需要在pipeline或者中间件中获取settings的属性，可以通过scrapy.crawler.Crawler.settings属性

class MyExtension(object):

    @classmethod
    def from_crawler(cls, crawler):
        settings = crawler.settings
        if settings['LOG_ENABLED']:
            print "log is enabled!"

三、一些设置：

1. DNS_TIMEOUT默认60s

2. DOWNLOADER_MIDDLEWARES下载中间件

3. DOWNLOAD_DELAY两次下载的间隔

4. DOWNLOAD_TIMEOUT默认180s

5. DOWNLOAD_MAXSIZE默认1024M

6. LOG_ENABLED

7. LOG_FILE默认是NONE

8. LOG_LEVEL，默认是DEBUG，即打印DEBUG, INFO, WARNING, ERROR，所有LOG信息

9. LOG_STDOUT，默认是false，所有的标准输出是否放在log中

10. MEMDEBUG_ENABLED，默认是false

11. RANDOMIZE_DOWNLOAD_DELAY默认是true, 等待0.5-1.5*DOWNLOAD_DELAY时间，防止被禁

12. USER_AGENT默认是”Scrapy/VERSION （+http://scrapy.org）

猜你喜欢

转载自blog.csdn.net/Bridge320/article/details/79262967

Scrapy Settings级别 & 如何获取settings & 一些可能用到的setting

scrapy中的settings设置

scrapy settings设置详解

scrapy settings配置

Scrapy_settings.py

scrapy-settings

Python:Scrapy的settings

Scrapy 中 settings 配置

关于Scrapy: 如何分别从Spider、Middleware、Pipeline获取settings.py里的参数

scrapy的配置文件settings

Scrapy框架----10Settings

scrapy settings配置文件

scrapy的settings中的常用设置.

Scrapy——settings配置文件

记录一下scrapy中 settings 的一些配置

Scrapy爬虫框架（三）---- settings设置

Scrapy学习篇（八）之settings

Scrapy框架中的settings配置设置

scrapy settings.py简单设置

爬虫12-scrapy框架settings的解读

scrapy settings配置文件详解

Scrapy结构学习——settings配置

scrapy_系统设置_settings.py

scrapy settings各个配置项详解

scrapy中的settings.py文件详情

scrapy配置参数(settings.py)

settings

scrapy 下爬取不同的网站，使用同一个settings时，设置自己的settings各个参数

scrapy 中settings.py配置文件详解

scrapy反反爬虫策略和settings配置解析

今日推荐

周排行

成为C++高手之宏与枚举

在CAD二次开发中使用进度条

Js插件ECharts，HighCharts学习网址整理

Celery提交任务出错(on windows.)

cephfs内核客户端性能追踪

thinkphp中PHPExcel用法

EntityFramework动态组合多排序字段

汇编语言（八）实验9 根据材料编程

安装ubuntu后必须做的事情（对我而言）

JS函数式编程

每日归档

更多

2024-10-22(0)

2024-10-21(0)

2024-10-20(0)

2024-10-19(0)

2024-10-18(0)

2024-10-17(0)

2024-10-16(0)

2024-10-15(0)

2024-10-14(0)

2024-10-13(0)