scrapy对接selenium【极简】代码（待完成） - 代码天地

scrapy对接selenium【极简】代码（待完成）

其他 2018-10-17 18:10:46 阅读次数: 0

方法

修改middlewares.py中的DownloaderMiddleware
修改配置文件settings.py，line55

简单版

# -*- coding: utf-8 -*-

from scrapy import signals
from scrapy.http import HtmlResponse
from selenium import webdriver


class ADownloaderMiddleware:

    @classmethod
    def from_crawler(cls, crawler):
        s = cls()
        crawler.signals.connect(s.spider_opened, signal=signals.spider_opened)
        return s

    def process_request(self, request, spider):
        driver = webdriver.Firefox()
        driver.get(request.url)
        page_source = driver.page_source
        driver.close()
        return HtmlResponse(url=request.url, body=page_source, request=request, encoding='utf-8', status=200)

    def process_response(self, request, response, spider):
        return response

    def spider_opened(self, spider):
        spider.logger.info('Spider opened: %s' % spider.name)

猜你喜欢

转载自blog.csdn.net/Yellow_python/article/details/83050047

scrapy对接selenium【极简】代码（待完成）

Scrapy对接Selenium

Scrapy 对接selenium

30.Scrapy 对接 Selenium

Scrapy对接selenium+phantomjs

Scrapy框架的使用之Scrapy对接Selenium

爬虫 scrapy 框架极简入门

TensorFlow【极简】入门代码

极客教程 scrapy和selenium

scrapy对接selenium并设置selenium不加载图片

JQuery极简代码2行代码完成轮播图，手动+自动切换

面试代码题总结（待完成）

scrapy对接selenium（下载中间件的使用）

极简OpenCV的相机标定代码

极简代码神器：Lombok使用教程

待完成

（待完成）

Scrapy实战---Scrapy对接selenium爬取京东商城商品数据

规范的python代码与高效的python代码---待完成

【Python】Python3纯代码极简教程

用极简的代码实现 Http 请求：AstraHttp 帮助文档

Python网络图【networkx】极简代码

html+css制作五环（代码极简）

30个极简Python代码，拿走即用

30个Python常用极简代码，开封即食

Graviton for mac(极简代码编辑器)

极简Python学习教程-----PDF转图片（代码）

SwiftUI极简教程05:代码分组管理

SwiftUI极简教程06:代码优雅复用

1027. 打印沙漏(20) Python代码极简AC

今日推荐

周排行

Leetcode简单题61~80

解决zookeeper磁盘IO高的问题

多线程相关方法详解

Maven-setting.xml文件详解

Maven 项目的 classpath 理解

渊亭科技大数据笔试题

配置JVM内存分配

计算机网络个人学习笔记（三）网络层：第三部分连载

js中两个等号(==)和三个等号(===)的区别

用C程序自动打开电脑上的程序

每日归档

更多

2024-09-18(0)

2024-09-17(0)

2024-09-16(0)

2024-09-15(0)

2024-09-14(0)

2024-09-13(0)

2024-09-12(0)

2024-09-11(0)

2024-09-10(0)

2024-09-09(0)