InputFormat解读 - 代码天地

InputFormat解读

编程语言 2018-05-11 18:33:31 阅读次数: 0

<div class="iteye-blog-content-contain" style="font-size: 14px"></div>

mapreduce 第一个步骤读取文件系统，解析成一个个key,value

InputFormat 子类就是处理这件事的。 InputFormat 两个核心抽象方法getSplits,creatRecordReader

1>getSplits方法：split the set of input files for the job. >Each {@link InputSplit} is then assigned to an individual {@link Mapper} for processing意思读取文件对原数据的切分一个个InputSplit

一个InputSplit 对应一个map 进程去处理.通过阅读FileInputSplit 源代码getSplit方法,可以知道

1个文件可以切分1个或者多个InputSplit,

更加抽象的得到：有多个block，就有几个InputSplit(默认配置）,就有个多少map任务.

2> createRecordReader方法:对于InputSplit解析key，value

Map任务是静态，Map进程动态.

为啥Maper k1,v1是LongWritable，Text

因为job默认处理类TextInputFormat<LongWritable，Text>已经定死了。

猜你喜欢

转载自liyunqiangyq.iteye.com/blog/2200379

InputFormat解读

MapReduce详细解读一（InputFormat）

InputFormat

hadoop inputformat

InputFormat的作用

InputFormat简析

自定义InputFormat

Hadoop之InputFormat

Hadoop InputFormat浅析

Hadoop的OutputFormat和InputFormat

MapReduce中的InputFormat

hadoop InputFormat getSplits

MR的inputFormat总结

hadoop的inputformat问题

Hadoop基础【1.2】 InputFormat

十一、MapReduce中的InputFormat

Hadoop组件之-MapReduce(InputFormat)

Hadoop常用的OutputFormat和InputFormat

MapReduce 之 InputFormat数据输入

MapReuce之输入类InputFormat

MapReduce源码解析之InputFormat

学习笔记 - Hadoop InputFormat 浅谈

RecordReader and InputFormat vs OutputFormat and RecordWriter

【大数据】MapReduce组件InputFormat

MapReduce【自定义InputFormat】

hadoop各种输入方法(InputFormat)汇总

Hadoop开发常用的InputFormat和OutputFormat

hadoop 自定义inputformat和outputformat

hadoop自定义inputformat源码

Hadoop深入学习：InputFormat组件

今日推荐

周排行

8种防盗链的方法

php的序列化和反序列化

Java 8：CompletableFuture

Android版本差异适配方案(5.0-9.0)

makedownpad使用

Spring Boot 使用AOP切面实现后台日志管理模块

实战SSM_O2O商铺_44【DES加密】关键配置信息进行DES加密

ACM排行榜说明

【转】SQL重复记录查询

板球和秃子威力那个大

每日归档

更多

2024-09-15(0)

2024-09-14(0)

2024-09-13(0)

2024-09-12(0)

2024-09-11(0)

2024-09-10(0)

2024-09-09(0)

2024-09-08(0)

2024-09-07(0)

2024-09-06(0)