Mapreduce 计算框架功能原理 - 代码天地

Mapreduce 计算框架功能原理

其他 2019-04-10 16:01:09 阅读次数: 0

版权声明：本文为博主原创文章，大家可以转载分享学习 https://blog.csdn.net/qq_31469369/article/details/84559801

mapreduce 计算框架原理分析

在这里插入图片描述

1. mapreduce是一个海量数据的计算框架

    **这个框架解决了以下问题：**
    基于一个多线程的模型  区别spark多进程
      
	 - 数据分布存储
	 - 作业调度
	 - 容错
	 - 机器间通信

  map： 把复杂的问题分解成简单的问题
 reduce：

2.mapreduce物理配置

合适的slot个数
-单记map reduce个数
-mapreduce.tasktracker.map,maximum(默认2)
-mapreduce.tasktracker.tasks.reduce.maxmum(默认2)
-内存限制
-cpu核数-1（一个进程tasktracker ）
-多机集群分离
磁盘状况
-合适的单机多磁盘
-mapred.local.dir和dfs.data.dir

注意点：

map个数为split的份数
压缩文件不可切分
非压缩文件可以切分
dfs.block.size决定block的大小 hadoop配置文件中配置

猜你喜欢

转载自blog.csdn.net/qq_31469369/article/details/84559801

Mapreduce 计算框架功能原理

MapReduce 框架原理

MapReduce框架原理

Hadoop：MapReduce框架原理

【hadoop】MapReduce分布式计算框架原理

hadoop之MapReduce框架原理

MapReduce计算框架（一）

MapReduce计算框架

**MapReduce计算框架

MapReduce框架原理之（二）MapReduce工作流程

MapReduce框架原理之MapReduce工作流程

MapReduce框架原理-MapTask工作机制

大数据框架MapReduce运行原理

MapReduce框架原理之（四）Join

MapReduce框架原理之InputFormat数据输入

MapReduce框架原理之ReduceTask工作机制

MapReduce框架原理之MapTask工作机制

MapReduce框架原理之Shuffle机制

对mapreduce分布式计算框架原理，进行完整流程分析

Hadoop大数据原理(3) - 分布式计算框架MapReduce

MapReduce 原理

MapReduce的原理

mapreduce原理

MapReduce计算模型二 MapReduce框架Hadoop应用(一)

MapReduce（3）--分布式计算框架MapReduce初体验

MapReduce（1）--分布式计算框架MapReduce介绍

分布式计算框架MapReduce总结

【Hadoop】MapReduce并行计算框架

分布式计算框架MapReduce入门

Hadoop2.8.5 MapReduce计算框架

今日推荐

周排行

Leetcode简单题61~80

解决zookeeper磁盘IO高的问题

多线程相关方法详解

Maven-setting.xml文件详解

Maven 项目的 classpath 理解

渊亭科技大数据笔试题

配置JVM内存分配

计算机网络个人学习笔记（三）网络层：第三部分连载

js中两个等号(==)和三个等号(===)的区别

用C程序自动打开电脑上的程序

每日归档

更多

2024-09-18(0)

2024-09-17(0)

2024-09-16(0)

2024-09-15(0)

2024-09-14(0)

2024-09-13(0)

2024-09-12(0)

2024-09-11(0)

2024-09-10(0)

2024-09-09(0)