爬虫01-一个简单的爬虫 - 代码天地

爬虫01-一个简单的爬虫

其他 2018-09-09 05:55:17 阅读次数: 0

什么是爬虫？

爬虫就是按照一定的规则，自动的抓取互联网信息的程序或者脚本，爬虫分为通用爬虫、聚焦爬虫、增量式爬虫、深度爬虫

下面是一个简单的爬虫

from urllib import request
from chardet import detect
response = request.urlopen('http:www.baidu.com')
html = response.read().decode()
print(html)

爬虫的分类

通用爬虫：抓取页面的html ，主要是将互联网上的网页下载到本地，形成一个互联网内容的镜像备份

聚焦爬虫：在实施网页的抓取时会对内容进行处理筛选，尽量保证值抓取与需求相关的网页信息

增量式爬虫：指在已经爬取了足够数量的网页，分为两种：一种是爬取的数据发生了变化，比如爬取csdn博客的内容，但博主可能改变他写的博客内容，这时候需要再次爬取数据对数据库里的数据进行更新，另一种是爬取的链接发生了变化，比如爬取一个新闻类网站的网页，新闻的信息变化的频率是非常快的，为了保持新闻的时效性，必须每个一段时间就再次爬取

深层爬虫：我们爬取一个网页时，网页中有很多的超链接，我们可以获取到超链接，对它继续进行爬取，这就是增量式爬虫

猜你喜欢

转载自blog.csdn.net/qwerLoL123456/article/details/82492766

爬虫01-一个简单的爬虫

Python爬虫--一个简单的爬虫

一个简单的爬虫——新闻爬虫

一个简单的爬虫

Python爬虫开发-01--最简单的一个爬虫模型

爬虫简单入门：第一个简单爬虫

爬虫简介及实现一个简单的爬虫Demo

爬虫---一个简单的贴吧爬虫

$python爬虫系列（1）——一个简单的爬虫实例

Java网络爬虫 - 一个简单的爬虫例子

【爬虫学习】一个简单的爬虫demo

爬虫：一个简单实例说明爬虫机制

一个简单的python爬虫程序

一个简单的爬虫实例

第一个简单的爬虫

golang写一个简单的爬虫

简单实现一个爬虫

Java实现一个简单的爬虫

一个简单的python爬虫

分享一个简单的爬虫

Python一个简单的爬虫实例

做一个简单的scrapy爬虫

一个简单的爬虫-多线程

一个简单的爬虫-多线程

go一个简单的爬虫（豆瓣）

一个简单的puppeteer爬虫

写一个简单的爬虫

一个简单的爬虫例子（代码）

01-什么是网络爬虫

Python爬虫教程-01-爬虫介绍

今日推荐

周排行

vue + echart +map中国地图，省市地图，区县地图

spring boot2 (31)-cors跨域请求

『学习资料推荐』299元买的微信营销资料打包

个人学习卷积神经网络的疑惑解答

网络工程师-软考

模拟人生4 春夏秋冬、星梦起飞版更新下载方法以及常见问题

python关于对象的字符串显示str和repr以及

奇怪的session混乱问题

【3】分治法（divide-and-conquer）

Java项目开发成绩管理系统（九）各模块实现信息修改

每日归档

更多

2024-08-07(0)

2024-08-06(0)

2024-08-05(0)

2024-08-04(0)

2024-08-03(0)

2024-08-02(0)

2024-08-01(0)

2024-07-31(0)

2024-07-30(0)

2024-07-29(0)