Input阶段将数据节点上的数据进行反序列化,然后划分切片。
数据切片:(1)一个job的map阶段并行度由客户端在提交job时的切片数决定
(2)每个切片分配一个MapTask并行实例处理
(3)默认情况下,切片的大小等于BlockSize,也就是数据块大小
Input阶段将数据节点上的数据进行反序列化,然后划分切片。
数据切片:(1)一个job的map阶段并行度由客户端在提交job时的切片数决定
(2)每个切片分配一个MapTask并行实例处理
(3)默认情况下,切片的大小等于BlockSize,也就是数据块大小