Python3-网页爬取-网页抓取汉字转码、多个参数拼接 - 代码天地

Python3-网页爬取-网页抓取汉字转码、多个参数拼接

其他 2018-05-12 22:55:30 阅读次数: 3

#网页抓取汉字转码、多个参数拼接
from urllib import request

#将汉字转成unicode码
from urllib import parse
# base_url='http://www.baidu.com/s?wd='

base_url='http://www.baidu.com/s?wd='
content=input('请输入你要搜索的内容：')

# base_url=base_url+content#当有一个参数时可以，但现实中会有很多参数，此时肯定不适用
qs={
    'wd':content,
    'rsv_sp':1
}
# print(qs)
# print(base_url)
qs=parse.urlencode(qs)
print(qs)
base_url=base_url+qs
headers={
    'user-agent':'Mozilla/5.0 (Windows NT 6.1; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/49.0.2623.221 Safari/537.36 SE 2.X MetaSr 1.0'

}
req=request.Request(base_url,headers=headers)
response=request.urlopen(req)
html=response.read()
html=html.decode('utf-8')

with open(content+'.html','w',encoding='utf-8') as f:
    f.write(html)

请输入你要搜索的内容：CSDN学院
wd=CSDN%E5%AD%A6%E9%99%A2&rsv_sp=1

Process finished with exit code 0

猜你喜欢

转载自blog.csdn.net/zbrj12345/article/details/79911750

Python3-网页爬取-网页抓取汉字转码、多个参数拼接

Python3-网页爬取-SSL验证

Python3-网页爬取-批量爬取贴吧页面数据

Python3-网页爬取-post方式实现百度翻译

Python3-爬虫~selenium\phantomjs\爬取XX网页电影过程中向下滚动网页问题

python爬取网页

python3爬取网页图片

python3 爬取天气网页

python爬虫爬取异步加载网页信息（python抓取网页中无法通过网页标签属性抓取的内容）

Python3-抓取某翻译网页获取js数据

python爬取多个网页表格并保存为csv

python爬虫学习资料以及多个网页爬取的源码

Python 爬虫爬取网页

python动态爬取网页

Python爬取网页图片

Python爬取网页title

python 爬取静态网页

python爬取网页（简易）

python爬取网页信息

【python】爬取网页图片

Python爬取网页内容

python爬取简单网页

python爬取网页视频

python3爬虫爬取网页图片简单示例

python3爬虫之二：爬取网页图片

python爬虫日志(3)-爬取异步加载网页

python3 爬取36氪新闻网页

Python3 -- 基于Splinter工具爬取网页资源

python3 从网页上爬取图片

python3 url 爬取网页并读写

今日推荐

周排行

Access的四舍五入取整

8.23 前端学习过程

入门学习过程方向与漏洞复现总结：

操作分布式文件之八：如何批量并行读写远程文件和事务补偿处理

应邀出个教程（搭建tensorflow跑网络环境）

Kubernetes之Pod控制器应用进阶

14-[mysql内置功能]--

HDU6212 区间dp 好题

VS2015生成代码图

验证手机号的工具类

每日归档

更多

2024-10-21(0)

2024-10-20(0)

2024-10-19(0)

2024-10-18(0)

2024-10-17(0)

2024-10-16(0)

2024-10-15(0)

2024-10-14(0)

2024-10-13(0)

2024-10-12(0)