Hadoop中GroupingComparatorClass的使用 - 代码天地

Hadoop中GroupingComparatorClass的使用

其他 2018-12-18 02:36:17 阅读次数: 0

版权声明：本文为博主原创文章，未经博主允许不得转载。 https://blog.csdn.net/qq_31246691/article/details/82156385

MapReduce的Reduce阶段的分组是按照Map阶段输出的Key来进行的，也就是Key相同就会分发到同一个Reduce中。但是今天在写一个推荐系统时遇到了这样的需求：
Map阶段输出的Key是我自定义的MyKey，它有两个字段：用户ID和其对应的推荐系数，现在有100个商品对于用户user1的推荐系数，如下：

<user1,1.0>
<user1,3.0>
<user1,2.0>
......

而在reduce阶段需要提取出推荐系数最高的前十个，所以就需要将用户ID相同的分发到同一个Reduce中，这时候就需要用到GroupingComparatorClass。下面的代码即我实现的GroupingComparatorClass。

class UserGroup extends WritableComparator{
        public UserGroup(){
            super(MyKey.class,true);
        }

        public int compare(WritableComparable a, WritableComparable b) {
            MyKey o1 =(MyKey) a;
            MyKey o2 =(MyKey) b;
            return o1.getUid().compareTo(o2.getUid());
        }
}

其中，getUid（是获取用户ID的方法），这样就可以将用户ID相同的分到同一个Reduce。
(注意：默认的构造方法必须有)

猜你喜欢

转载自blog.csdn.net/qq_31246691/article/details/82156385

Hadoop中GroupingComparatorClass的使用

Hadoop 中RPC使用

压缩在Hadoop中的使用

"Hadoop在ebay中的使用历程"分享总结

hadoop使用中的几个小细节(二)

Hadoop中的Python框架的使用指南

使用python实现Hadoop中MapReduce

大数据-什么是Hadoop？Hadoop的起源与国内应用、Hadoop作为插件在eclipse中的使用

Hadoop的使用

hadoop+hive使用中遇到的问题汇总

centos7 中hadoop2.6.0-cdh5.9.3使用

在VMWare中建立Hadoop虚拟集群的详细步骤使用CentOS

关于hadoop中MapReduce使用对象类型数据问题

初学Hadoop——HDFS Java API 的使用、在linux中安装eclipse

【分布式】hadoop安装篇（9）在Ubuntu中使用CDH安装hadoop集群（中）

Hadoop - Hadoop中CombineFileInputFormat 理解

[Hadoop]使用Hadoop进行ReduceSideJoin

Hadoop—hadoop fs 命令使用

Hadoop中MapReduce中combine、partition、shuffle的作用，程序中的使用

Hadoop中hdfs的错误

Docker中的Hadoop

Hadoop中的各种排序

Hadoop中InterfaceAudience 注解

hadoop FSNamesystem中的recentInvalidateSets

Hadoop中CombineFileInputFormat详解

hadoop中的balancer

hadoop中的NullpointException

hadoop中运行wordcount

hadoop 在eclipse 中调试

Hadoop在Eclipse中的配置

今日推荐

周排行

成为C++高手之宏与枚举

在CAD二次开发中使用进度条

Js插件ECharts，HighCharts学习网址整理

Celery提交任务出错(on windows.)

cephfs内核客户端性能追踪

thinkphp中PHPExcel用法

EntityFramework动态组合多排序字段

汇编语言（八）实验9 根据材料编程

安装ubuntu后必须做的事情（对我而言）

JS函数式编程

每日归档

更多

2024-10-22(0)

2024-10-21(0)

2024-10-20(0)

2024-10-19(0)

2024-10-18(0)

2024-10-17(0)

2024-10-16(0)

2024-10-15(0)

2024-10-14(0)

2024-10-13(0)