spark部分:改变rdd的分区数coalesce,repartition,glom,randomSplit的区别

小转大必须开启shuffle

大转小开启shuffle:再次分区

大转小不开启分区:任意合并

 

 

 

猜你喜欢

转载自blog.csdn.net/wyqwilliam/article/details/82110995