年份:2018
日期:9-9
知识来源:hadoop权威指南
1>hadoop为我们提供了一个可靠的共享存储和分析系统,hdfs实现数据的存储,MapReduce实现数据的分析和处理
2>MapReduce是一个批量查询处理器,能够在合理的时间范围内针对整个数据集的动态查询
3>MapReduce对非接过话和半结构化数据分厂有效
4>MapReduce是一种线性的可伸缩编程模型
5>数据本地化特性是MapReduce的核心特性
MapReduce的设计目标:
1>为只需短短几分钟或者几个小时就可以完成的作业提供服务
2>运行于同一个内部有搞笑网络连接的数据中心内
3>数据中心内的计算机是可靠的,订制的硬件