HadoopMapReduce运行机制

其他 2018-11-23 23:37:55 阅读次数: 0

1.map方法读取一个文件的一行记录进行分析, 输入:LongWritable(当前读取的文件位置), Text(内容)

2.map将读取到的信息进行分类,输入Context (键值对) ;作为Reduce 的输入数据

3.当所有的map运行完后,mapreduce 框架会通过一个Patitioner 类进行reduce输入数据的分发.

默认的分发规则为:通过比较两个key的hashCode值与reduce个数取摩,

/** Use {@link Object#hashCode()} to partition. */
public int getPartition(K2 key, V2 value,
int numReduceTasks) {
return (key.hashCode() & Integer.MAX_VALUE) % numReduceTasks;
}

返回的摩就是目标reduce task

猜你喜欢

转载自www.cnblogs.com/liuyongpingblog/p/10010168.html

HadoopMapReduce运行机制

Handler运行机制

JVM运行机制

JavaScript运行机制

spring运行机制

dubbo 运行机制

HDFS 的运行机制

DNS的运行机制

JSP运行机制

Android 的运行机制

mapreduce运行机制

SpringMvc运行机制

nodejs运行机制

YARN的运行机制

JS运行机制

运行机制

代码运行机制

session是运行机制

JavaScript 运行机制

C运行机制

YARN运行机制

session运行机制

scrapy运行机制

HDFS的运行机制

java的运行机制

python的运行机制

MapTask运行机制

Hbase运行机制

RabbitMQ运行机制

javascript的运行机制

今日推荐

周排行

成为C++高手之宏与枚举

在CAD二次开发中使用进度条

Js插件ECharts，HighCharts学习网址整理

Celery提交任务出错(on windows.)

cephfs内核客户端性能追踪

thinkphp中PHPExcel用法

EntityFramework动态组合多排序字段

汇编语言（八）实验9 根据材料编程

安装ubuntu后必须做的事情（对我而言）

JS函数式编程

每日归档

2024-10-22(0)

2024-10-21(0)

2024-10-20(0)

2024-10-19(0)

2024-10-18(0)

2024-10-17(0)

2024-10-16(0)

2024-10-15(0)

2024-10-14(0)

2024-10-13(0)