聚合转换算子（归约聚合(reduce)） - 代码天地

聚合转换算子（归约聚合(reduce)）

业界资讯 2023-09-08 21:41:59 阅读次数: 0

import org.apache.flink.api.common.functions.ReduceFunction
import org.apache.flink.api.java.functions.KeySelector
import org.apache.flink.streaming.api.scala.{StreamExecutionEnvironment, createTypeInformation}

/**
 * DATE:2022/10/4 13:22
 * AUTHOR：GX
 */
object TransformationAggTest {
  def main(args: Array[String]): Unit = {
    val env = StreamExecutionEnvironment.getExecutionEnvironment
    env.setParallelism(1)

    val stream = env.addSource(new ClickSource)
    //1.1相同Key一定会分配到同一个分区，不同Key有可能分配到同一个分区
    //keyBy -> keyedStream -> DataStream
    //有状态的流处理，如果要使用聚合算子，要使用在只含有有限个key的数据流上，如果key无限多，则会消耗完内存资源
//    stream.keyBy(_.user)
//      .maxBy("timestamp")
//      .print()
    //1.2
//    stream.keyBy(new MyKeySelector)
//      .maxBy("timestamp")
//      .print()
    //2.reduce规约聚合,提取当前最活跃用户
    stream.map(x => (x.user,1L))
      .keyBy(_._1)
      .reduce(new MyReduce) //统计每个用户的活跃度
      .keyBy(x => true)  //将所有数据按照同样的Key分到同一个组中
//      .maxBy("_2")
      .reduce( (statu,x) => if (x._2 >= statu._2) x else statu ) //选取当前最活跃的用户
      .print()

    env.execute()
  }
  class MyKeySelector extends KeySelector[Event,String] {
    override def getKey(value: Event): String = value.user
  }
  class MyReduce extends ReduceFunction[(String,Long)]{
    override def reduce(value1: (String, Long), value2: (String, Long)): (String, Long) = {
      (value1._1,value1._2 + value2._2)
    }
  }
}

猜你喜欢

转载自blog.csdn.net/GX_0824/article/details/127161921

聚合转换算子（归约聚合(reduce)）

Flink 常用API（2）——转换算子＋聚合算子

Spark核心编程(RDD转换算子)之聚合算子

MongoDB 聚合group、aggregate、Map Reduce

reduce端连接-分区分组聚合

MongoDB 聚合操作Map-Reduce

RDD算子转换算子

Java 8 Stream实用篇，玩转集合的筛选、归约、分组、聚合

sparkStreaming转换算子

聚合

spark算子调优reduceByKey本地聚合

spark-聚合算子aggregatebykey

Java8中聚合操作collect、reduce方法详解

学习MongoDB 十： MongoDB聚合（Map-Reduce）（二）

Java8 Stream 中的 reduce() 方法，执行聚合操作

Java8 Stream：2万字20个实例，玩转集合的筛选、归约、分组、聚合

Java8 Stream：2 万字 20 个实例，玩转集合的筛选、归约、分组、聚合

Java8 Stream：两万字博文教你玩转集合的筛选、归约、分组、聚合

sparkStreaming转换算子02

spark的转换算子2

Flink（五）转换算子

Spark的RDD转换算子

Flink-转换算子

Spark之RDD算子-转换算子

Spark RDD算子整理 -- 转换算子行动算子

spark通过combineByKey算子实现条件性聚合的方法

spark算子调优五：reduceByKey本地聚合

Spark 性能调优 Rdd 之 reduceByKey 本地聚合（也就是map端聚合算子）

【Spark】Spark 转换算子详解

【Kafka】kafka 转换算子（详解）

今日推荐

零基础入门鸿蒙开发 HarmonyOS NEXT星河版开发学习

豆包MarsCode帮我2小时完成Go语言系统从开发、测试到部署全流程最佳实践，云IDE迁移PHP企业级项目最佳实践

内幕！smardaten无代码平台全方位测评，这些细节你绝对想不到！

idea安装及激活配置流程---2024旗舰版(需激活码)

Elastic 创始人：热爱开源，希望合作 OSI 创建新许可证

工业互联网标识解析体系开放开源下载服务中心发布

IDEA取消自动选择光标所在行

828华为云征文 | 使用Flexus X实例搭建Dubbo-Admin服务

Programmer&AI—AI辅助编程学习指南

【Linux】虚拟机安装 openEuler 24.03 X86_64

o1 发布后 Sam Altman 最新访谈：AI 发展不仅没有放缓，而且我们对未来几年已经胜券在握

AI芯片国产化率100%！运营商最大单集群智算中心投产

周排行

【后端】 Spring Cloud 服务间调用

Git 学习教程

Salesforce集成(三). 获取数据02_获取Object和Field信息

Oracle执行计划的稳定（使用MANUAL类型的SQL PROFILE）

js跨域请求之jsonp原理和运用

ios -解决view遮挡按钮问题

【PAT天梯赛】L2-003 月饼（25 分)（贪心思想）

hive 存储格式的生产应用

【Python实践-6】将不规范的英文名字，变为首字母大写，其他小写的规范名字

容器学习点点滴滴（二）

每日归档

更多

2024-10-03(2)

2024-10-02(60)

2024-10-01(0)

2024-09-30(0)

2024-09-29(0)

2024-09-28(4)

2024-09-27(60)

2024-09-26(0)

2024-09-25(0)

2024-09-24(0)