版权声明: https://blog.csdn.net/qq_25233621/article/details/80978096
urllib库 #urlretrieve 导入 import urllib.request
urlretrieve方法 --------------------------------------------------------------------------------------#直接将远程数据下载到本地 路径:path = "D:\\"+name+".MP3"
urllib.request.urlretrieve(url,filename,reporthook,data)
filename:制定了保存到本地的路径,(如果未指定该参数,urllib会生成一个临时文件来保存数据)
reporthook:是一个回调函数,当连接上服务器以及响应的数据模块传输完毕的时候就会触发该回调函数,我们可以用这个回调函数来显示当前的下载进度
urlretrieve方法 --------------------------------------------------------------------------------------#直接将远程数据下载到本地 路径:path = "D:\\"+name+".MP3"
urllib.request.urlretrieve(url,filename,reporthook,data)
filename:制定了保存到本地的路径,(如果未指定该参数,urllib会生成一个临时文件来保存数据)
reporthook:是一个回调函数,当连接上服务器以及响应的数据模块传输完毕的时候就会触发该回调函数,我们可以用这个回调函数来显示当前的下载进度
data:指post到服务器的数据。该方法返回一个包含两个元素的元祖(filename,headers)filename表示保存到本地的路径,headers表示服务器响应首部。
图片爬取实例:
import requests
import time
Bs ={'user-agent':'HuoHu/12.0.1'}#浏览器
path = "d:/imagine.jpg"#存储路径
print('输入网址:')
#网上 壁纸网站 均可输入网站
url=input()
r = requests.get(url,headers=Bs)
print(r.headers)
try:
with open(path,'wb') as f:
f.write(r.content)#返回二进制形式
time.sleep(5)
f.close()
print("successful")
except:
time.sleep(5)
print('faile')