版权声明:本文为博主原创文章,未经博主允许不得转载。 https://blog.csdn.net/yangguosb/article/details/85058402
Flink介绍
Flink是Apache开源的一款流式计算框架,具有高吞吐、低延时、容错性好(能保障Exactly Once语义),以及能同时支持流处理和批处理的特点;
Flink not only provides real-time streaming with high throughput and exactly-once guarantees, but it’s also an engine for batch data processing.
Flink技术栈
- 部署方式:Flink支持部署在主流的资源管理框架上,比如Hadoop YARN, Apache Mesos, and Kubernetes等,同时也支持单机部署;
核心要素
- Checkpoint:Exactly-Once语义实现的关键;
- State:如果当前事件的处理结果与之前事件有关,则称为有状态处理;相反,如果当前事件的处理结果只与事件本身相关,则为无状态的;
- Window:流计算的基本单元,window将无限的流分隔成有限大小的bucket进行处理;
- Time:定义事件的顺序;
参考: