MapReduce_input阶段

Input阶段将数据节点上的数据进行反序列化,然后划分切片。

数据切片:(1)一个job的map阶段并行度由客户端在提交job时的切片数决定

     (2)每个切片分配一个MapTask并行实例处理

     (3)默认情况下,切片的大小等于BlockSize,也就是数据块大小

     

猜你喜欢

转载自www.cnblogs.com/lihui001/p/12516712.html