我的爬虫笔记(五)

其他 2021-11-21 23:31:39 阅读次数: 0

状态码不是200解决方案

以他为例子,进行爬取内容

内容出现,至于有什么用,那是以后的事

但是有的时候,会访问错误,就是状态码不是200,是其他值,这时就需要我们进行其他操作了.

为了找个状态码不是200的找个半天......

终于,出现了,觉得国外的不容易连接...

首先我们连接失败,肯定是有原因的.

我们输入r.request.headers查看头部信息

这里我们访问网址时,我们的名字叫做"python-requests/2.26.0",所以网站判断我们是爬虫,拒绝我们的访问.

通过上一篇我们知道.网站就是通过来源审查判断的,上一篇

那么我们以前也学了通过某种方式,来替换我们的头部信息

通过重新创建键值,来替换我们的头部信息,这样就可以访问成功了

此时还可以看一下我们的头部信息

看,已经被替换了.至于为什莫换成"Molila/5.0" 还不太清楚,有机会了,换成其他的也试试..

那么现在我们通过text可以获取网页内容了

猜你喜欢

转载自blog.csdn.net/qq_53950686/article/details/119254097

我的爬虫笔记(五)

python我的爬虫笔记

我的爬虫笔记(四)

我的爬虫笔记（六）

Python爬虫学习笔记（五）

Python网络爬虫学习笔记（五）

爬虫笔记（五）——异常处理代码框架

python | 爬虫笔记（五）- 数据存储

python爬虫学习笔记(五)-URLError与Cookie

Python爬虫学习笔记（五）————JsonPath解析

python爬虫笔记（五）网络爬虫之提取——实例优化：中国大学排名爬虫

python爬虫笔记（五）网络爬虫之提取——实例：中国大学排名爬虫

python爬虫笔记（五）——动态网页处理（下篇）

python爬虫学习笔记五：Re库的介绍和使用

爬虫笔记：正则表达式（五）

[ python] 爬虫笔记（五) 数据解析之xpath解析

#Python学习笔记——爬虫的自我养成（一）

学习笔记--我的第一个爬虫项目

我的Python爬虫入门到项目研发心得笔记

嵩天老师爬虫实例笔记（五）--股票数据Scrapy爬虫实例

这是我的爬虫笔记，希望的对正在学习Python爬虫的你有所帮助！

一入爬虫深似海，从此游戏是路人！总结我的python爬虫学习笔记！

一入爬虫深似海，从此游戏是路人！总结我的python爬虫学习笔记

听说你想学爬虫？Scrapy快速入门！给我五分钟，包你学会爬虫！

《我的PaddlePaddle学习之路》笔记五——验证码的识别

《跟我一起写Makefile》学习笔记（五）

我的Git笔记第五篇—标签管理

我的JavaScript笔记——五、原型与原型链（重点）

爬虫笔记

Python爬虫学习（五）

今日推荐

周排行

AIZU 2224 Save your cats(并查集)

HTTP响应头状态码详解

Python socket编程（2）

MaxCompute Studio使用心得系列7—作业对比

Supervisor安装使用

LeetCode 164. Maximum Gap

mysql面试题: 一张表里面有ID自增主键，当insert了17条记录之后，删除了第15,16,17条记录，再把mysql重启，再insert一条记录，这条记录的ID是18还是15

nutch1.2 DeleteDuplicates IndexMerger 详解

OC - @property与setter,getter方法

SpringBoot @Transactional的rollbackFor属性

每日归档

更多

2024-09-19(0)

2024-09-18(0)

2024-09-17(0)

2024-09-16(0)

2024-09-15(0)

2024-09-14(0)

2024-09-13(0)

2024-09-12(0)

2024-09-11(0)

2024-09-10(0)