爬虫学习笔记（一）---获取页面、图片、百度翻译

编程语言 2019-04-04 10:40:54 阅读次数: 0

获取百度页面
1，确定url
2，打开url
3，返回一个html 16进制
4，转化为utf8
5，存入本地

import urllib.request
url = "http://www.baidu.com"
response = urllib.request.urlopen(url)
data = response.read()
#data数据本来为bytes类型数据，需要转换为str数据
html = data.decode("utf8")
#将html数据存入到文件中
with open("baidu.html","w",encoding="utf8") as f :
    f.write(html)

获取百度的图片

获取百度翻译

1，找到json
2，找到url
3，找到接口，请求方式

F12>>左上角屏蔽键>>点击一下翻译>>找到json数据

在这里插入图片描述找到url

找到传入参数（data）
在这里插入图片描述
确定json格式，用在线json工具

在这里插入图片描述确定hero位置

伪装爬虫身份
寻找User-Agent:
在这里插入图片描述 1，在创建request对象的时候，填入headers参数（包含User Agent信息），这个Headers参数要求为字典；
2，在创建Request对象的时候不添加headers参数，在创建完成之后，使用add_header()的方法，添加headers。

猜你喜欢

转载自blog.csdn.net/qq_32166779/article/details/85015792

爬虫学习笔记（一）---获取页面、图片、百度翻译

爬虫（一）百度翻译

【学习笔记】python3 爬虫-百度图片

最新百度翻译爬虫获取sign（python爬虫）

爬虫基本的get获取和post百度翻译

爬虫学习之9：结合百度翻译API爬取PEXELS网站图片

python爬虫学习（三）百度翻译

百度图片爬虫

爬虫 -- 百度图片

python爬虫百度翻译

爬虫实现百度翻译

爬虫JS渗透百度翻译

通过爬虫使用百度翻译

反爬虫破解——百度翻译

Python爬虫学习笔记二：百度贴吧网页图片抓取

学习笔记（爬虫）：爬取百度贴吧，美女吧图片

爬虫（一）抓取百度页面的内容

post请求获取百度翻译

调用百度API(一)——百度翻译

python爬虫学习京东页面、亚马逊访问|、百度搜索、网上爬取图片 DAY2

基于Tkinter以及百度翻译爬虫做的一个小的翻译软件

python 百度图片爬虫

python爬虫(百度图片)

爬虫_百度图片下载

百度图片爬虫教程

Python——百度图片爬虫

爬虫_百度贴吧图片

爬虫——百度图片爬取

前段学习笔记----制作一个静态百度首页页面

实现百度图片搜索页面

今日推荐

周排行

深度学习------Lingvo框架下的加速通道GPipe

webjars管理静态资源

C专家编程_2.2

mysql 源码安装

json文件操作

123231432

注解的实现

Spring MVC 控制器

《人月神话》读后感二

C#使用HttpWebRequest和HttpWebResponse上传文件示例

每日归档

2024-09-08(0)

2024-09-07(0)

2024-09-06(0)

2024-09-05(0)

2024-09-04(0)

2024-09-03(0)

2024-09-02(0)

2024-09-01(0)

2024-08-31(0)

2024-08-30(0)