MapReduce 过程发生多少次排序

总共可能发生 4 次排序过程:


1)Map 阶段:
环形缓冲区:对 key按照字典排序。排序手段:快速排序(能够手写快排)
溢写到磁盘中:对多个溢写的文件进行排序。排序手段:分区归并排序(能够手写归并)


2)Reduce 阶段:
按指定分区读取到 reduce缓存中(不够落盘):归并排序
Reduce task前分组排序:自定义

猜你喜欢

转载自www.cnblogs.com/guoyu1/p/12218490.html