爬虫总结1 - 代码天地

爬虫总结1

其他 2018-12-03 11:34:17 阅读次数: 0

1. 爬虫的流程

a. url
b. 发送请求获取响应
c. 提取的数据，就处理保存
d. 提取的是url，重复b步骤

2. http和https的概念

http 超文本 传输 协议 80
https http+ssl 443

3. 浏览器最终展示出来的结果，是多次请求对应的多次响应共同渲染的结果

4. 必须关注的请求头和响应头

User-Agent
Referer
Cookie
Set-cookie

5. requests模块发送简单的get请求

response = requests.get('http://host:port')

6. response常用属性

response.url
response.status_code 

response.headers
response.request.headers

response.cookies
response.request._cookies

7. response响应的文本内容

response.text str 
response.content bytes
# 解决中文显示乱码问题
response.content.decode('utf8')
# ascii gbk gb2312 iso-8859-1

8. 图片或音频视频保存本地要以bytes类型保存！

猜你喜欢

转载自blog.csdn.net/u012087012/article/details/84751124

爬虫总结1

【爬虫解析1】：XPath总结

python爬虫个人总结篇1

【python爬虫专题】解析方法 <1> Urllib库方法总结

爬虫总结——（1）request使用以及文件存储

210305课 1st爬虫重点总结

爬虫总结

爬虫（1）——爬虫前奏

爬虫1

爬虫（1）

爬虫(1)

爬虫（１）

爬虫--1

爬虫-1

爬虫之路（1）：认识爬虫

爬虫开发.1爬虫介绍

python爬虫1 - 爬虫概要

爬虫开发_爬虫概述（1）

爬虫总结1——爬取异步请求（XHR/JS）数据方法

股票爬虫项目总结

Python爬虫总结

最全Python爬虫总结

爬虫问题总结

python爬虫面试总结

python爬虫知识总结

爬虫----代码段总结

爬虫经验小总结

python笔记--爬虫总结

python 爬虫总结

简单爬虫总结

今日推荐

AI小程序有哪些？AI小程序哪个好用？微信小程序AI写作叫什么？免费的ai小程序推荐 ai写作小程序推荐

灵办AI工具(科研学术,代码编程,学习辅导,图书报告)功能介绍

Linux内核源码分析（非常详细）零基础入门到精通，收藏这一篇就够了

【C++篇】启航——初识C++（上篇）

数据飞轮崛起：数据中台真的过时了吗？

828华为云征文——使用Flexus云服务器X实例CentOS镜像下创建MySQL服务器教程

阿里巴巴出品的6款AI神器，你用过几个？

【机器学习】多模态AI——融合多种数据源的智能系统

HashiCorp 创始人向 Zig 软件基金会捐赠 30 万美元

1-8 月我国软件业务收入 85492 亿元，同比增长 11.2%

零基础入门鸿蒙开发 HarmonyOS NEXT星河版开发学习

豆包MarsCode帮我2小时完成Go语言系统从开发、测试到部署全流程最佳实践，云IDE迁移PHP企业级项目最佳实践

周排行

Ubuntu+apache2+php5+mysql+phpmyadmin的php环境搭建

基于YOLOv3+Kalman-Filter实现Multi-target tracking

解释C++实例化类的指针类型中的new

苹果手机页面不兼容问题——mui

Python基础语法

javascript学习笔记一【预解释】

python内置函数 map

【Git】使用webstorm操作git

this与super关键字（一）

python list 使用技巧

每日归档

更多

2024-10-04(63)

2024-10-03(2)

2024-10-02(60)

2024-10-01(0)

2024-09-30(0)

2024-09-29(0)

2024-09-28(4)

2024-09-27(60)

2024-09-26(0)

2024-09-25(0)