实验时发现,如果不设置mapper类的话,会默认设置一个reducer,需要通过job.setNumReduceTask(0)
将reducer设置为0。
若没有reducer,则直接输出mapper的原始中间结果,不进行conbiner(即使设置了combiner),sort等一些列操作。
若设置了reducer,即使不设置combiner,系统也将设置一个默认的combiner,如下图所示:
未设置reducer,直接输出map后的数据,其中第四、五行重复了。
若设置了reducer,第一行后面只有一个0000000005,多余的被combiner了。