python爬虫系列(1.1-urllib中常用方法的介绍) - 代码天地

python爬虫系列(1.1-urllib中常用方法的介绍)

其他 2018-11-09 03:04:02 阅读次数: 0

一、关于`urllib`中常用方法的介绍

1、urlopen网络请求

urlopen方法是网络请求的方法,默认是get请求,如果传递了data是post请求
1. from urllib import request
3. if __name__ == "__main__":
4. response = request.urlopen('http://www.baidu.com')
5. print(response.read())
2、urlretrieve下载文件
1. from urllib import request
3. if __name__ == "__main__":
4. # 下载整个网页
5. request.urlretrieve('http://www.baidu.com', 'baidu.html')
6. # 下载图片
7. request.urlretrieve('http://www.baidu.com/img/bd_logo1.png', 'baidu.png')

二、关于编码的处理

1、urlencode将字典类型数据转换为parsed模式
1. from urllib import parse
3. if __name__ == "__main__":
4. dict1 = {
5. "name": "hello",
6. "age": "20",
7. "gender": "man"
8. }
9. re = parse.urlencode(dict1)
10. print(re) # name=hello&age=20&gender=man
2、parse_qs和parse_qsl反序列化
```
 
```
1. from urllib import parse
3. if __name__ == "__main__":
4. dict1 = {
5. "name": "hello",
6. "age": "20",
7. "gender": "man"
8. }
9. re = parse.urlencode(dict1)
10. print(re)
11. print(parse.parse_qs(re))

三、切割`url`的方法

1、urlsplit和urlparse方法
```
 
```
1. from urllib import request, parse
3. if __name__ == "__main__":
4. url = 'http://www.baidu.com?name=hello&age=20'
5. print(parse.urlsplit(url))
6. print(parse.urlparse(url))
8. # 输出
9. # SplitResult(scheme='http', netloc='www.baidu.com', path='', query='name=hello&age=20', fragment='')
10. # ParseResult(scheme='http', netloc='www.baidu.com', path='', params='', query='name=hello&age=20', fragment='')

猜你喜欢

转载自blog.csdn.net/qq_40925239/article/details/83862440

python爬虫系列(1.1-urllib中常用方法的介绍)

爬虫基础 || 1.1 urllib 基础介绍

python爬虫系列(1.2-urllib模块中request 常用方法)

Python爬虫1.1 — urllib基础用法教程

Python爬虫---urllib库介绍

python 爬虫 urllib模块介绍

JavaScript 1.1 数组中常用的方法详

1.1-Python爬虫案例演示urllib/requests

Python3爬虫urllib使用介绍

Python爬虫系列-Urllib库详解

python爬虫（一）：urllib（不常用）

python爬虫常用库之urllib详解

《想学Python爬虫系列》chrome在爬虫使用方法介绍

Python爬虫库urllib，requests基本方法

Python中常用的内置方法

Python中常用的方法功能

python中爬虫中常用的语句命令

爬虫中常用的加密逻辑（python实现）

python 爬虫之urllib 库的相关模块的介绍以及应用

python爬虫系列一——urllib基本请求库

【python爬虫专题】解析方法 <1> Urllib库方法总结

爬虫--Python常用模块之requests,urllib和re

python爬虫——urllib库

Python爬虫——urllib的使用

PYTHON爬虫（urllib详解）

python爬虫，Urllib库

Python爬虫--urllib

Python 爬虫 ---- urllib 库

Python网络爬虫--urllib

Python爬虫(一) | urllib

今日推荐

周排行

LRU cache算法

windows10, 自带的OpenSSH, key权限问题, 文件权限问题

测试用例书写方法

HIVE-默认分隔符的（linux系统的特殊字符）查看，输入和修改

最贵的AMD 7nm显卡来了！这设计够狂野

java多线程简单demo

[ 转载 ]在Android系统上使用busybox——最简单的方法

QT connect学习

BFSIFT算法分析

Xcode10：library not found for -lstdc++.6.0.9 临时解决

每日归档

更多

2024-08-06(0)

2024-08-05(0)

2024-08-04(0)

2024-08-03(0)

2024-08-02(0)

2024-08-01(0)

2024-07-31(0)

2024-07-30(0)

2024-07-29(0)

2024-07-28(0)