Hadoop的初级学习记录

其他 2019-06-23 16:21:15 阅读次数: 0

Hadoop的初级学习记录

1.为什么会出现hadoop？

当我们的数据非常大的时候，比如100T的数据，这时候用我们普通的数据库来存储、分析、处理数据的时候就会非常的耗时而且效率特别低，那么这时候就出现了hadoop等的框架来处理大数据的问题。

2.hadoop解决了哪些问题？

（1）利用HDFS来存储数据
（2）用MapReduce来分析处理数据

3.hadoop处理数据的流程是什么？

如果我们现在遇到了这样的一个问题：一个服务器上有2000T的数据这时候我们有两个用户需要访问这台服务器上的数据，这时候如果这台服务器坏了那么我们的用户就无法访问了，那么利用hadoop可以咋样处理这个问题呢？

（1）首先，我们将数据进行切片，将数据分成多片然后放在不同的服务器中。
	HDFS负责通过namecode将数据block在不同的服务器中，然后客户端
	最先访问到的就是namecode，然后才可以访问到datacode。
（2）最后通过MapReduce进行海量数据的计算。

4.MapReduce的计算过程是怎么样的呢？

需要说明的是将所有数据都通过带宽传输然后进行计算是不可能实现的。

（1）map阶段：各个主机在自己的本地将数据分析计算出来
（2）reduce阶段：一台主机负责将map阶段各个主机分析出来的数据进行统计（可以有分成多个reduce）。

猜你喜欢

转载自blog.csdn.net/weixin_42600398/article/details/85473261

Hadoop的初级学习记录

Zookeeper的初级学习记录

jquery的初级学习记录1

hadoop学习记录

记录Hadoop学习---HDFS

Hadoop学习疑问记录

hadoop|学习记录

pySpark学习记录与hadoop

hadoop初级

webpack 4.x 初级学习记录

hadoop学习记录1 初始hadoop

Hadoop学习记录（一、Hadoop集群的搭建）

Hadoop学习记录（五、hadoop IO操作）

Hadoop学习记录（三、MapReduce）

hadoop学习爬坑记录

Hadoop 初级概念总结

[学习记录]MySQL之初级查询语句（select,where）

hadoop学习记录—2.7.4documentation—hdfs

Hadoop 学习记录 - 基础概念篇

Hadoop慕课网学习记录

Hadoop学习记录（二、hdfs shell命令）

Hadoop学习记录（六、MapReduce测试）

学习记录：搭建简单的hadoop,spark

Hadoop学习记录（四、hadoop实现文件操作）

学习记录——eclipse通过hadoop插件连接Hadoop

[学习线路] 零基础学习hadoop到上手工作线路指导（初级篇）

Hadoop初级之shell脚本

Hadoop初级之Linux命令

Hadoop初级之Hive配置

Hadoop实战-初级部分之 Hadoop IO

今日推荐

周排行

深度学习------Lingvo框架下的加速通道GPipe

webjars管理静态资源

C专家编程_2.2

mysql 源码安装

json文件操作

123231432

注解的实现

Spring MVC 控制器

《人月神话》读后感二

C#使用HttpWebRequest和HttpWebResponse上传文件示例

每日归档

更多

2024-09-08(0)

2024-09-07(0)

2024-09-06(0)

2024-09-05(0)

2024-09-04(0)

2024-09-03(0)

2024-09-02(0)

2024-09-01(0)

2024-08-31(0)

2024-08-30(0)