Scrapy的架构[图解] - 代码天地

Scrapy的架构[图解]

其他 2018-08-31 07:00:43 阅读次数: 0

这就是整个Scrapy的架构图了；

这里写图片描述

Scrapy机构流程过程

Scrapy Engine》Spider Middlewares》Spiders》Scheduler
》Downloader Middlewares》Downloader》Spiders》Item Pipeline

Scrapy Engine（引擎）:

这是引擎，负责Spiders、ItemPipeline、Downloader、Scheduler中间的通讯，信号、数据传递等等！（像不像人的身体？）

Scheduler(调度器):

它负责接受引擎发送过来的requests请求，并按照一定的方式进行整理排列，入队、并等待Scrapy Engine(引擎)来请求时，交给引擎。

Downloader（下载器）：

负责下载Scrapy Engine(引擎)发送的所有Requests请求，并将其获取到的Responses交还给Scrapy Engine(引擎)，由引擎交给Spiders来处理，

Spiders：

它负责处理所有Responses,从中分析提取数据，获取Item字段需要的数据，并将需要跟进的URL提交给引擎，再次进入Scheduler(调度器)，

Item Pipeline：

它负责处理Spiders中获取到的Item，并进行处理，比如去重，持久化存储（存数据库，写入文件，总之就是保存数据用的）

Downloader Middlewares（下载中间件）：

你可以当作是一个可以自定义扩展下载功能的组件

Spider Middlewares（Spider中间件）：

你可以理解为是一个可以自定扩展和操作引擎和Spiders中间‘通信‘的功能组件（比如进入Spiders的Responses;和从Spiders出去的Requests）

猜你喜欢

转载自blog.csdn.net/Black_God1/article/details/82107724

Scrapy的架构[图解]

Scrapy架构

Scrapy 架构

scrapy架构及原理

scrapy-redis架构

Scrapy-架构

Scrapy框架架构

【scrapy学习】-----架构

Scrapy架构下载及安装

Scrapy架构图

爬虫（Scrapy架构）

python(scrapy爬虫架构)

scrapy架构个人解读

爬虫框架（scrapy架构）

scrapy架构流程

scrapy基本架构

Scrapy 架构介绍

爬虫之Scrapy架构

架构图解

Android系统架构（图解）

Scrapy----Scrapy架构及工作流程

scrapy框架-架构流程介绍

Scrapy的架构与原理的理解【转】

[python爬虫]Scrapy架构的使用

scrapy-cluster集群的架构

Python技术：Scrapy架构介绍

理解Scrapy爬虫框架架构

系统架构图解

图解Kafka架构与工作原理

图解架构 | SaaS、PaaS、IaaS

今日推荐

周排行

成为C++高手之宏与枚举

在CAD二次开发中使用进度条

Js插件ECharts，HighCharts学习网址整理

Celery提交任务出错(on windows.)

cephfs内核客户端性能追踪

thinkphp中PHPExcel用法

EntityFramework动态组合多排序字段

汇编语言（八）实验9 根据材料编程

安装ubuntu后必须做的事情（对我而言）

JS函数式编程

每日归档

更多

2024-10-22(0)

2024-10-21(0)

2024-10-20(0)

2024-10-19(0)

2024-10-18(0)

2024-10-17(0)

2024-10-16(0)

2024-10-15(0)

2024-10-14(0)

2024-10-13(0)