Hadoop课程

作者:gqk

1,Hadoop的前世今生:

2,hadoop是什么:

  Hadoop实现了一个分布式文件系统(Hadoop Distributed File System),简称HDFS,Hadoop的框架最核心的设计就是:HDFS和MapReduce。HDFS为海量的数据提供了存储,则MapReduce为海量的数据提供了计算。 [2] 

3,什么是分布式文件系统:

  指文件系统管理的物理存储资源不一定直接连接在本地节点上,而是通过计算机网络与节点相连

4,hadoop的四大组件:

  common、HDFS、MapReduce、YARN

  common:Hadoop常用的工具类,

  HDFS:Hadoop实现了一个分布式的文件系统,HDFS为海量的数据提供了存储

  MapReduce:基于YARN的大型数据集并行处理系统。是一种计算模型,用以进行大数据量的计算。

  yarn:分布式集群资源管理框架,管理者集群的资源

 


 5,HDFS:分布式文件系统:

  

 

  

猜你喜欢

转载自www.cnblogs.com/520gqk/p/9592021.html