爬虫-timeout机制-避免网页假死长时间不加载 - 代码天地

爬虫-timeout机制-避免网页假死长时间不加载

其他 2018-10-26 20:37:10 阅读次数: 0

版权声明：我是南七小僧，微信: to_my_love ，欢迎交流思想碰撞。 https://blog.csdn.net/qq_25439417/article/details/83033450

爬虫有时候会因为爬去某些网页速度极慢，影响性能。所有可以设置超时时间。
timeout单位秒
设置超时时间为12，使用try语句。

#coding:utf-8
**urllib2**
超时可以通过 urllib2.urlopen() 的 timeout 参数直接设置。
例如:
#coding:utf-8
import urllib2
try:
    url = "http://www.baidu.com"
    f = urllib2.urlopen(url, timeout=12) #timeout设置超时的时间
    result = f.read()
    print result
except Exception as e:
    print ('a',str(e))

如果要永远等待，只需传入一个None

二、错误与异常 1、遇到网络问题（如：DNS 查询失败、拒绝连接等）时，Requests 会抛出一个 ConnectionError 异常。 2、如果 HTTP 请求返回了不成功的状态码， Response.raise_for_status() 会抛出一个 HTTPError 异常。 3、若请求超时，则抛出一个 Timeout 异常。 4、若请求超过了设定的最大重定向次数，则会抛出一个 TooManyRedirects 异常。 5、所有Requests显式抛出的异常都继承自 requests.exceptions.RequestException 。 ---------------------

这样在爬虫的时候，能较好的避免网页假死。

猜你喜欢

转载自blog.csdn.net/qq_25439417/article/details/83033450

爬虫-timeout机制-避免网页假死长时间不加载

避免长时间gc

php异步实现，避免长时间等待

接口长时间无结果项目线程假死

Android避免弹出大量Toast，长时间不消失

VB.NET学习笔记：程序长时间执行任务时窗体会失去响应造成假死避免重复点击按钮的解决思路

Ubuntu服务器长时间运行爬虫程序

Python爬虫长时间出现SSL证书验证问题

winfrom中避免加载数据时窗口假死

Vue3 - 实现网页白屏加载期间自动插入 “自定义“ 加载 loading 动画，每当页面打开加载时就会自动显示动画或图片文件（全局注入网站首屏加载等待动画，利用动态图或动画解决长时间白屏的问题）

Genymotion长时间处在加载状态的解决方案

android studio快速导入其他人的项目，避免下载gradle长时间卡住

如何避免后台IO高负载造成的长时间JVM GC停顿(转)

执行ALTER TABLE语句时如何避免长时间阻塞并发查询

怎么查看网页加载的时间

基于.net程序，使用cefsharp开发的打开网页工具，如何不加载图片

ios 后台运行机制以及保持程序在后台长时间运行

1114Selenium web自动化测试经验分享-设置网页超时加载时间set_page_load_timeout()

vue优化初次进入项目长时间加载白屏问题-添加首屏加载

source 不加载js

onCreate不加载布局

度量网页加载性能的几个时间指标

iOS 网页加载时间监控方案实现

【面试题】如何解决 Vue首屏加载过慢出现长时间白屏？

项目不加载js文件

SVN长时间更新报错

长时间握手处理

如何长时间高效学习？

tomcat 长时间启动不了

iOS 长时间后台运行

今日推荐

周排行

Leetcode简单题61~80

解决zookeeper磁盘IO高的问题

多线程相关方法详解

Maven-setting.xml文件详解

Maven 项目的 classpath 理解

渊亭科技大数据笔试题

配置JVM内存分配

计算机网络个人学习笔记（三）网络层：第三部分连载

js中两个等号(==)和三个等号(===)的区别

用C程序自动打开电脑上的程序

每日归档

更多

2024-09-18(0)

2024-09-17(0)

2024-09-16(0)

2024-09-15(0)

2024-09-14(0)

2024-09-13(0)

2024-09-12(0)

2024-09-11(0)

2024-09-10(0)

2024-09-09(0)