python使用urlretrieve下载文件时出现403 forbidden的解决方法（反爬虫） - 代码天地

python使用urlretrieve下载文件时出现403 forbidden的解决方法（反爬虫）

其他 2019-04-26 17:17:33 阅读次数: 0

python使用urlretrieve下载文件时出现403 forbidden的解决方法

出现该错误的原因是服务器开启了反爬虫，一般情况下只需要设置header模拟浏览器即可，但是urlretrieve并未提供header参数。

使用urlopen也可以直接下载文件，例

headers = {“User-Agent”: “Mozilla/5.0 (Windows NT 6.3; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/59.0.3071.86 Safari/537.36”}
def down_pic(url, path):
try:
req = request.Request(url, headers=headers)
data = request.urlopen(req).read()
with open(path, ‘wb’) as f:
f.write(data)
f.close()
except Exception as e:
print(str(e))
还有一种解决方法：

opener=urllib.request.build_opener()
opener.addheaders=[(‘User-Agent’,‘Mozilla/5.0 (Windows NT 6.1; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/36.0.1941.0 Safari/537.36’)]
urllib.request.install_opener(opener)
urllib.request.urlretrieve(url, Path)

转载：https://www.213.name/archives/1087

猜你喜欢

转载自blog.csdn.net/shuidefu/article/details/88931350

python使用urlretrieve下载文件时出现403 forbidden的解决方法（反爬虫）

python使用urlopen/urlretrieve下载文件时出现403 forbidden的解决方法【转载】

nginx出现403 Forbidden解决方法

nginx 403 forbidden解决方法

apache 403错误 Forbidden解决方法

Nginx 403 Forbidden错误的解决方法

apache服务出现Forbidden 403问题的解决方法总结

权限问题导致Nginx 403 Forbidden错误的解决方法

nginx报错403 forbidden几个解决方法

403 Forbidden错误的原因和解决方法

Nginx 403 forbidden 错误的原因及解决方法

解决Python爬虫在爬资源过程中使用urlretrieve函数下载文件不完全且避免下载时长过长陷入死循环，并在下载文件的过程中显示下载进度

python 手动给requests模块添加urlretrieve下载文件方法！

nginx 搭建图片服务器出现 403 forbidden的解决方法

python爬虫出现HTTPError ：403：forbidden错误！

Centos下Apache整合Tomcat访问报Forbidden 403 错误的解决方法

WampServer 2.5设置手机访问（403 Forbidden错误解决方法）

Nginx 403 forbidden 错误的五种原因及解决方法（详细）

python 爬虫禁止访问解决方法（403）

四种解决Nginx出现403 forbidden 报错的方法

Python | 常见的反爬及解决方法，值得收藏

python之文件下载（urllib模块urlretrieve方法）

使用HttpServletResponse对象下载文件时，第二次下载时报错的解决方法

Springboot实战_使用下载、导出功能时，下载文件名称乱码或者变____的解决方法

python爬虫中文乱码解决方法

解决Nginx出现403 forbidden

php 文件下载出现下载文件内容乱码损坏的解决方法

urllib使用三--urlretrieve下载文件

[WinError 10061] 由于目标计算机积极拒绝，无法连接。 keyerror:192。 HTTP Error 403: Forbidden。解决方法

python爬虫下载文件

今日推荐

周排行

LRU cache算法

windows10, 自带的OpenSSH, key权限问题, 文件权限问题

测试用例书写方法

HIVE-默认分隔符的（linux系统的特殊字符）查看，输入和修改

最贵的AMD 7nm显卡来了！这设计够狂野

java多线程简单demo

[ 转载 ]在Android系统上使用busybox——最简单的方法

QT connect学习

BFSIFT算法分析

Xcode10：library not found for -lstdc++.6.0.9 临时解决

每日归档

更多

2024-08-06(0)

2024-08-05(0)

2024-08-04(0)

2024-08-03(0)

2024-08-02(0)

2024-08-01(0)

2024-07-31(0)

2024-07-30(0)

2024-07-29(0)

2024-07-28(0)