C 3. 背诵 - scrapy爬虫常用页面解析测试方法

其他 2018-07-21 21:04:51 阅读次数: 0

scrapy爬虫页面解析测试工具

描述：编写页面解析代码时，需要预先执行代码，查找错误，有两种方法

方法一： scrapy shell < URL > 命令

# 运行完这条命令后，页面信息会打包放在 response 中
scrapy shell http://books.com

方法二：通过 requests 构造 response

from scrapy.selector import Selector
from scrapy.http import HtmlResponse
import requests

body = requests.get('http://bang.dangdang.com/books/bestsellers/01.00.00.00.00.00-month-2018-6-1-1').text
response = HtmlResponse(url='http://example.com', body=body, encoding='utf-8')

name = response.xpath('//div[@class="name"]//@title').extract_first()

猜你喜欢

转载自blog.csdn.net/qq_41682050/article/details/81148522

C 3. 背诵 - scrapy爬虫常用页面解析测试方法

C 4. 背诵 - scrapy爬虫编写流程

C 1. 背诵 - 常用指令（18年7月）

面试背诵版—C++

⭐️Halcon常用api背诵版

C 2. 背诵 - scrapy数据封装、处理、存储常用命令（18年7月）

C++常用库函数 3.数据转换函数

3. 方法

3. $()下的常用方法

编程训练[C语言]——简单分治法代码背诵

背诵再背诵

Flutter 3. 页面布局

GIT：3.命令解析

3. Spark SQL解析

3.解析库beautifulsoup

TestNg 3.忽略测试

3. vsftpd常用配置

3. maven 常用指令

3. java 方法入门

C#笔记——3.泛型

3. C 共用体 union

C++基础：3.共用体

3. C语言 -- 变量与常量

【c++】3.复合类型

C语言初阶——3.数组

C++ 3.安装雷达

C# 3.创建多线程

测试3.测试方法的分类

诗词背诵

单词背诵

今日推荐

周排行

成为C++高手之宏与枚举

在CAD二次开发中使用进度条

Js插件ECharts，HighCharts学习网址整理

Celery提交任务出错(on windows.)

cephfs内核客户端性能追踪

thinkphp中PHPExcel用法

EntityFramework动态组合多排序字段

汇编语言（八）实验9 根据材料编程

安装ubuntu后必须做的事情（对我而言）

JS函数式编程

每日归档

更多

2024-10-22(0)

2024-10-21(0)

2024-10-20(0)

2024-10-19(0)

2024-10-18(0)

2024-10-17(0)

2024-10-16(0)

2024-10-15(0)

2024-10-14(0)

2024-10-13(0)