Structured Streaming 作为 Spark 家族的新成员,通过 Spark SQL/DataFrame 来处理 Batch/Streaming 数据,基本的 SparkSQL API 即可实现离线处理和流式处理,大大的方便了流式计算的开发,另外还提供了丰富的功能。
本次 Chat 就是从零开始,带领大家认识学习 Structured Streaming,主要内容包括:
- Structured Streaming 基本案例;
- Process 与 Event 窗口的区别及 Watermarks 的使用;
- 三种 Output Modes 方式;
- Streaming Queries 的监控。
阅读全文: http://gitbook.cn/gitchat/activity/5c24ca12a11fd6601d19ff36
一场场看太麻烦?成为 GitChat 会员,畅享 1000+ 场 Chat !点击查看