Scrapy 爬虫框架工作原理 - 代码天地

Scrapy 爬虫框架工作原理

物联网 2023-08-06 14:02:04 阅读次数: 0

官方：

翻译

Scrapy Engine(引擎)：负责Spider、ItemPipeline、Downloader、Scheduler中间的通讯，信号、数据传递等。

Scheduler(调度器)：它负责接受引擎发送过来的Request请求，并按照一定的方式进行整理排列，入队，当引擎需要时，交还给引擎。

Downloader（下载器）：负责下载Scrapy Engine(引擎)发送的所有Requests请求，并将其获取到的Responses交还给Scrapy Engine(引擎)，由引擎交给Spider来处理。

Spider（爬虫）：它负责处理所有Responses,从中分析提取数据，获取Item字段需要的数据，并将需要跟进的URL提交给引擎，再次进入Scheduler(调度器)。

Item Pipeline(管道)：它负责处理Spider中获取到的Item，并进行进行后期处理（详细分析、过滤、存储等）的地方。

Downloader Middlewares（下载中间件）：一个可以自定义扩展下载功能的组件。

Spider Middlewares（Spider中间件）：一个可以自定扩展和操作引擎和Spider中间通信的功能组件。

猜你喜欢

转载自blog.csdn.net/weixin_46310452/article/details/126035686

Scrapy 爬虫框架工作原理

[爬虫框架scrapy]scrapy的安装

Python的爬虫框架scrapy----原理介绍

爬虫进阶之Scrapy框架原理及实现

对scrapy经典框架爬虫原理的理解

pyhton爬虫学习（十三）：scrapy框架原理

爬虫框架scrapy基本原理

scrapy框架结构与工作原理

Python爬虫 scrapy框架原理，scrapy开发流程

爬虫框架Scrapy 之(四) --- scrapy运行原理(管道）

Scrapy框架爬虫案例

爬虫框架之Scrapy

scrapy爬虫框架

爬虫框架Scrapy

爬虫Scrapy框架详解

Scrapy爬虫框架（二）

scrapy 框架 python 爬虫

爬虫——Scrapy框架

python爬虫-scrapy框架

爬虫 - Scrapy框架

爬虫----Scrapy框架

scrapy 爬虫框架简介

爬虫--scrapy框架

scrapy爬虫框架学习

Scrapy爬虫框架初识

爬虫之 scrapy框架

Scrapy框架-----爬虫

python爬虫scrapy框架

Python爬虫框架—Scrapy

Scrapy框架爬虫

今日推荐

周排行

Access的四舍五入取整

8.23 前端学习过程

入门学习过程方向与漏洞复现总结：

操作分布式文件之八：如何批量并行读写远程文件和事务补偿处理

应邀出个教程（搭建tensorflow跑网络环境）

Kubernetes之Pod控制器应用进阶

14-[mysql内置功能]--

HDU6212 区间dp 好题

VS2015生成代码图

验证手机号的工具类

每日归档

更多

2024-10-21(0)

2024-10-20(0)

2024-10-19(0)

2024-10-18(0)

2024-10-17(0)

2024-10-16(0)

2024-10-15(0)

2024-10-14(0)

2024-10-13(0)

2024-10-12(0)