python 爬虫：https; HTTPSConnectionPool(host='z.jd.com', port=443) - 代码天地

python 爬虫：https; HTTPSConnectionPool(host='z.jd.com', port=443)

其他 2020-04-10 00:37:02 阅读次数: 0

1. 第一种方案

import requests
requests.get('https://www.zhihu.com/',verify=False)

2. 第二种方案

由于python2不支持SNI，具体SNI了解转：http://blog.csdn.net/makenothing/article/details/53292335如果想python2支持SNI，pip安装3个模块：

 1.pyOpenSSL
 2.ndg-httpsclient
 3.pyasn1

然后在使用requests请求前添加如下代码：

import urllib3.contrib.pyopenssl
urllib3.contrib.pyopenssl.inject_into_urllib3()

使用第一种方案解决的时候，出现以下警告：

InsecureRequestWarning: Unverified HTTPS request is being made. Adding certificate verification is strongly advised.

在语句前加上以下代码即可不会被报错：requests.packages.urllib3.disable_warnings()

经过试验测试，第一，二种方案都会继续报错。

继续寻找方案（链接四）：

使用requests下载日志出现：HTTPSConnectionPool(host='***', port=443): Max retries exceeded with url: ******(Caused by SSLError(SSLError(1, u'[SSL: CERTIFICATE_VERIFY_FAILED] certificate verify failed (_ssl.c:579)'),))

分析是ssl证书报错，解决办法：

1. requests默认是keep-alive的，可能没有释放，加参数 headers={'Connection':'close'}

requests..get("http://...", headers={'Connection':'close'})

2. 增加连接重试次数：

requests.adapters.DEFAULT_RETRIES = 5

3. 关闭多余的连接：requests使用了urllib3库，默认的http connection是keep-alive的，requests设置False关闭。

操作方法：

s = requests.session()       s.keep_alive = False

4. 不用ssl证书验证：

requests.get('https://kennethreitz.org', verify=False)

使用（1,2,3）方法即可解决：

参考：

https://www.zhihu.com/question/40025043

https://blog.csdn.net/k53247l2/article/details/74168894

https://blog.csdn.net/qq_31077649/article/details/79013199

http://www.cnblogs.com/mikeluwen/p/7244161.html

京城王多鱼

发布了39 篇原创文章 · 获赞 12 · 访问量 16万+

私信关注

猜你喜欢

转载自blog.csdn.net/wdh315172/article/details/80491668

python 爬虫：https; HTTPSConnectionPool(host='z.jd.com', port=443)

解决python爬虫requests.exceptions.SSLError: HTTPSConnectionPool(host='XXX', port=443)问题

解决python爬虫requests.exceptions.SSLError: HTTPSConnectionPool(host=‘XXX‘, port=443)问题

python HTTPSConnectionPool(host='rapzh.coms', port=443)

Could not fetch URL https://pypi.org/simple/mysql-python/: There was a problem confirming the ssl certificate: HTTPSConnectionPool(host='pypi.org', port=443):解决方案

ReadTimeoutError: HTTPSConnectionPool(host='pypi.python.org', port=443): Read timed out.

解决安装Python包时超时失败ReadTimeoutError: HTTPSConnectionPool(host='files.pythonhosted.org', port=443)

python pip3 出现 HTTPSConnectionPool(host='pypi.org', port=443)

安装MySQL-python库解决方案HTTPSConnectionPool(host=‘pypi.org‘, port=443)

Python安装库显示HTTPSConnectionPool(host=‘files.pythonhosted.org‘, port=443): Read Time out.

requests.exceptions.SSLError: HTTPSConnectionPool(host=‘.*.‘, port=443): 开启代理时无法使用python的requests库

How to solve ReadTimeoutError: HTTPSConnectionPool(host=‘pypi.python.org‘, port=443) with pip?

python pip install 报：HTTPSConnectionPool(host='files.pythonhosted.org', port=443): Read timed out.错误

Python利用国内镜像安装包 HTTPSConnectionPool(host='files.pythonhosted.org', port=443): Read timed out

fatal: unable to access 'https://github.com/***': Failed to connect to github.com port 443:Timed out

Push failed Unable to access ‘https://github.com/‘: Failed to connect to github.com port 443: Timed

fatal: unable to access ‘https://github.com/*****‘: Failed to connect to github.com port 443 after

ReadTimeoutError: HTTPSConnectionPool(host=‘cdn-lfs.huggingface.co‘, port=443)

requests.exceptions.ConnectionError: HTTPSConnectionPool(host=‘raw.githubusercontent.com‘, port=443)

OpenAI调用API报错 time out：HTTPSConnectionPool(host=‘api.openai.com‘, port=443)

selenium+python自动化83-pip安装selenium报Read time out HTTPSConnectionPool(host='pypi.python.org' port443）

anaconda 报错HTTPSConnectionPool(host='www.anaconda.com', port=443): Read timed out. (read timeout=5)

windows环境pip安装时一直报错Could not fetch URL https://pypi.org/simple/xrld/: There was a problem confirming the ssl certificate: HTTPSConnectionPool(host='pypi.org', port=443): Max retries exceeded with url:

ReadTimeoutError: HTTPSConnectionPool(host='files.pythonhosted.org', port=443): Read timed out.

pip install SSLError: HTTPSConnectionPool(host='files.pythonhosted.org', port=443):

HTTPSConnectionPool(host='files.pythonhosted.org', port=443): Read timed out

requests.exceptions.SSLError: HTTPSConnectionPool(host='pt.morning-star.cn', port=443): Max retries

pip3.ReadTimeoutError: HTTPSConnectionPool(host='files.pythonhosted.org', port=443): Read timed out.

pip .ReadTimeoutError: HTTPSConnectionPool(host='files.pythonhosted.org', port=443): Read timed out.

关于requests.exceptions.SSLError: HTTPSConnectionPool(host='XXX', port=443)问题

今日推荐

AI小程序有哪些？AI小程序哪个好用？微信小程序AI写作叫什么？免费的ai小程序推荐 ai写作小程序推荐

灵办AI工具(科研学术,代码编程,学习辅导,图书报告)功能介绍

Linux内核源码分析（非常详细）零基础入门到精通，收藏这一篇就够了

【C++篇】启航——初识C++（上篇）

数据飞轮崛起：数据中台真的过时了吗？

828华为云征文——使用Flexus云服务器X实例CentOS镜像下创建MySQL服务器教程

阿里巴巴出品的6款AI神器，你用过几个？

【机器学习】多模态AI——融合多种数据源的智能系统

HashiCorp 创始人向 Zig 软件基金会捐赠 30 万美元

1-8 月我国软件业务收入 85492 亿元，同比增长 11.2%

零基础入门鸿蒙开发 HarmonyOS NEXT星河版开发学习

豆包MarsCode帮我2小时完成Go语言系统从开发、测试到部署全流程最佳实践，云IDE迁移PHP企业级项目最佳实践

周排行

Ubuntu+apache2+php5+mysql+phpmyadmin的php环境搭建

基于YOLOv3+Kalman-Filter实现Multi-target tracking

解释C++实例化类的指针类型中的new

苹果手机页面不兼容问题——mui

Python基础语法

javascript学习笔记一【预解释】

python内置函数 map

【Git】使用webstorm操作git

this与super关键字（一）

python list 使用技巧

每日归档

更多

2024-10-04(63)

2024-10-03(2)

2024-10-02(60)

2024-10-01(0)

2024-09-30(0)

2024-09-29(0)

2024-09-28(4)

2024-09-27(60)

2024-09-26(0)

2024-09-25(0)