爬虫基础------urllib基础与超时设置 - 代码天地

爬虫基础------urllib基础与超时设置

其他 2020-02-18 10:22:38 阅读次数: 0

1.urllib的几个相关函数，各个函数的具体功能如案例代码所示：


import urllib.request
# urlretrieve(网址，本地文件的存储地址)直接下载网页到本地
urllib.request.urlretrieve("http://www.baidu.com","E:\\Pythondemo\\Python-test\\PythonLX\\dld.html")

# 清除数据缓冲，减少内存浪费
urllib.request.urlcleanup()
# info-----得到当前爬取相应的情况
file = urllib.request.urlopen("http://read.douban.com/provider/all")
print(file.info())
# getcode----返回网页爬取当期的状态码（200正确状态码 ^200则获取失败）
print("-----------")
print(file.getcode())
# 获取当前访问的网页url,geturl()
print("===========")
print(file.geturl)

案例运行结果：

备注：本博客如有疑问，欢迎大家在评论区留言-------本博客的博主觉得他就是查找爬虫过程中你想获取的有用信息以及查找错误，实际没个啥可标注的！！！

2.超时设置案例代码：

# 超时设置
import urllib.request
for i in range(0,100):
    try:
        file = urllib.request.urlopen("http://yum.iqianyue.com", timeout=0.25)
        #不输出len也行，直接file.read()也是OK的
        print(len(file.read()))
    except Exception as err:
        print("出现异常"+str(err))

超时设置的运行结果：

发布了98 篇原创文章 · 获赞 34 · 访问量 3万+

私信关注

猜你喜欢

转载自blog.csdn.net/weixin_42133768/article/details/96739168

爬虫基础------urllib基础与超时设置

Python网络爬虫：爬虫原理、正则表达式、正则表达式函数、urllib基础、超时设置

urllib基础、超时设置、Get与Post请求、异常处理、浏览器伪装、Python新闻爬虫实战

爬虫基础——urllib模块

爬虫--urllib基础

爬虫框架urllib 之(二) --- urllib基础

python 爬虫urllib基础示例

爬虫基础urllib库了解

爬虫基础之urllib库

爬虫基础(1):urllib库

python爬虫之urllib,伪装,超时设置,异常处理

爬虫基础 || 1.1 urllib 基础介绍

爬虫基础框架之urllib(一) --- urllib post请求

python 爬虫基础之urllib 库详解

（十五）Python爬虫基础库：urllib

【网络爬虫】：Python：url基础：urllib

python爬虫基础02-urllib库

Python 爬虫基础教程-Urllib详解

爬虫基础 || 1.2 urllib.request

Python爬虫1.1 — urllib基础用法教程

Python——关于爬虫基础Urllib实战

urllib 的基础

urllib基础

Python爬虫基础：简单的爬虫入门示例（urllib库）

菠菜平台出售爬虫基础urllib库了解

python爬虫基础知识（一）--Urllib.request

python爬虫基础教程：urllib库（二）

python爬虫基础教程：urllib库（一）

【零基础学爬虫】Urllib库的使用

小白学 Python 爬虫（12）：urllib 基础使用（二）

今日推荐

周排行

深度学习------Lingvo框架下的加速通道GPipe

webjars管理静态资源

C专家编程_2.2

mysql 源码安装

json文件操作

123231432

注解的实现

Spring MVC 控制器

《人月神话》读后感二

C#使用HttpWebRequest和HttpWebResponse上传文件示例

每日归档

更多

2024-09-08(0)

2024-09-07(0)

2024-09-06(0)

2024-09-05(0)

2024-09-04(0)

2024-09-03(0)

2024-09-02(0)

2024-09-01(0)

2024-08-31(0)

2024-08-30(0)