爬虫之request库主要解析---参照慕课北理工嵩天

kv = {'key1':'value1','key2':'value2'}
r = requests.request (' GET' , 'http://python123.io/ws' , params =kv)
print(r.url)

'''

requests.request(methid,url,**kwargs)

**kwargs:控制访问参数,均为可选项

params:字典或字节序列,作为参数增加到url中

'''

body = '主体内容'
r = requests.request('post','http://python123.io/ws' ,data=body)

'''
**keargs:控制访问的参数,,均为可选项
data:字典、字节序列或文件对象,作为Request的内容
'''


kv = {'key1':'valuel'}
r = requests.request('post','http://python123.io/ws',json=kv )

'''

**keargs:控制访问的参数,均为可选项
json:json格式的数据,作为request的内容
'''

hd = {'user-agent':'Chrome/10'}
r = requests.request('post','http://python123.io/ws',headers=hd )

'''

**kwargs:控制访问参数,均为可选项

headers:字典,http定制头

作用:模拟任何想模拟的浏览器向服务器发起访问

'''

'''

其他**keargs

**kwargs:控制访问的参数,均为可选选项

cookies:字典或CookieJar,Request中的cookie

auth:元组,支持HTTP认证功能

'''

#**kwargs:控制访问参数,均为可选项

# files:字典类型,传输文件

#作用:向某一个链接 ,提交某一个文件,在特定条件下非常有用

fs = {'file':open('data.xls','rb')}

r = requests.request('POST','http://python123.io/ws',files = fs)

#**kwargs:控制访问参数,均为可选项

# timeout:设定超时时间,秒为单位

# 作用:再发起request请求时在设定时间内没有返回请求,将产生timeout的异常

r = requests.request('GET','http://www.baidu.com',timeout = 10)

#**kwargs:控制访问参数,均为可选项

#proxies:字典类型,设定访问代理服务器,可以增加登录认证

#作用:用代理服务器可以有效地隐藏用户,爬取网的原的ip地址信息,有效防止爬虫的逆追踪

pxs = {'http':'http:user:[email protected]:1234'

    'http':'https:10.10.10.1:4321' }

r = requests.request('GET' , 'http://www.baidu.com',proxies=pxs)

'''

#**kwargs:控制访问参数,均为可选项

alloe_redirects:True/Fales,默认为True,重定向开关

stream:True/Fales, 默认为True,获取内容立即下载开关

verify:True/False,默认为True,认证SSL证书开关

cert:本地SSL证书路径

'''

'''

类比requests的方法

requests.get(url,params = None,**kwargs)

url:你获取页面的url链接

params:url中的额外参数,字典或字节流格式,可选

**kwargs:12个控制访问的参数

requests.head(url,**kwatgs)

url:拟获取页面的url链接

**kwargs:13个控制访问的参数

requests.post(url,data=None,json=None,**kwatgs)

url:拟更新页面的url链接

data:字典,字节序列或文件,Request的内容

json:JSON格式的数据,Request的内容

**kwargs:11个控制访问的参数

requests.put(url,data=None,**kwargs)

url:拟更新页面的url链接

data:字典,字节序列或文件,Request的内容

**kwargs:12个控制访问的参数

requests.patch(url,data=None,**kwargs)

url:拟更新页面的url链接

data:字典,字节序列或文件,Request的内容

**kwargs:12个控制访问的参数

requsets.delete(url,**kwargs)

url:拟删除页面的url链接

**kwatgs:13个控制访问的参数

'''

猜你喜欢

转载自www.cnblogs.com/nannong923484082/p/11850413.html