理论篇之大数据篇

年份:2018

日期:9-9

知识来源:hadoop权威指南

1>hadoop为我们提供了一个可靠的共享存储和分析系统,hdfs实现数据的存储,MapReduce实现数据的分析和处理

2>MapReduce是一个批量查询处理器,能够在合理的时间范围内针对整个数据集的动态查询

3>MapReduce对非接过话和半结构化数据分厂有效

4>MapReduce是一种线性的可伸缩编程模型

5>数据本地化特性是MapReduce的核心特性

MapReduce的设计目标:

1>为只需短短几分钟或者几个小时就可以完成的作业提供服务

2>运行于同一个内部有搞笑网络连接的数据中心内

3>数据中心内的计算机是可靠的,订制的硬件

猜你喜欢

转载自blog.csdn.net/zjc_jia/article/details/82557414