Scrapy练习笔记-2

其他 2018-10-12 03:41:17 阅读次数: 0

继续-1的天气爬虫
先爬后取
在weather文件夹下出现两张网页的源代码
之前顶了item容器，现在从两个网页中的源代码中找出
title
link
desc
分别保存提取出来。
在cmd命令中

C:\D\mypython\weather>scrapy shell 
"http://www.weather.com.cn/weather/101190401.shtml"

将它载入之后就可以进行操作了
可以得到response的回应

>>> response.body

得到网页的代码

>>> response.headers

网页的头
从body中找出
title
link
desc
用XPath找title

>>>response.xpath('//title/text()').extract()   #将得到的title字符串化
['【苏州天气】苏州天气预报,蓝天,蓝天预报,雾霾,雾霾消散,天气预报一周,天气预报15天查询']

找到原网页中有用的信息

>>> sel.xpath('//ul/li/text()')

猜你喜欢

转载自blog.csdn.net/weixin_43139613/article/details/82768997

Scrapy练习笔记-2

Scrapy练习笔记-1

Scrapy爬虫笔记——2

scrapy笔记2

Scrapy:学习笔记(2)——Scrapy项目

python爬虫框架——scrapy(2) 实战练习

numpy练习笔记2

JavaScript练习笔记(2)

scrapy笔记【2】[Spider类介绍]

scrapy 学习笔记2 数据持久化

爬虫框架Scrapy学习笔记-2

python入门练习笔记_2

2 Scrapy

scrapy笔记

Scrapy 笔记

scrapy Pipeline 练习

scrapy练习1

数据库查询练习-简单查询练习及笔记(2)

Python学习笔记——编程练习（2）

javascript学习笔记2：按钮练习

.NET MVC2 练习笔记

算法笔记贪心练习题（2）

CSS从入门到放弃练习笔记(2)

HTML从入门到放弃练习笔记(2)

Scrapy爬虫笔记(scrapy、scrapy-redis、scrapyd部署scrapy)

pyhon之scrapy框架练习

Python爬虫（入门+进阶）学习笔记 2-2 Scrapy安装及基本使用

Scrapy入门（2）

Scrapy学习日记2

scrapy 学习2

今日推荐

周排行

8种防盗链的方法

php的序列化和反序列化

Java 8：CompletableFuture

Android版本差异适配方案(5.0-9.0)

makedownpad使用

Spring Boot 使用AOP切面实现后台日志管理模块

实战SSM_O2O商铺_44【DES加密】关键配置信息进行DES加密

ACM排行榜说明

【转】SQL重复记录查询

板球和秃子威力那个大

每日归档

2024-09-15(0)

2024-09-14(0)

2024-09-13(0)

2024-09-12(0)

2024-09-11(0)

2024-09-10(0)

2024-09-09(0)

2024-09-08(0)

2024-09-07(0)

2024-09-06(0)