Flink的官网简述

1、flink-无界数据集-有界数据集

  1. 针对无界数据持久化计算
    数据源源不断产生的,就是流水一样。

  2. 数据类型
    无界:不断产生数据
    有界:最终,不再改变的数据集


2、flink-两种执行模型

  1. 执行模型
    两种执行模型分别是:流计算、批处理

流计算:数据不断产生,就一直处于计算状态
批处理:完成一定时间段的计算任务后,释放资源


3、flink的特征

  1. 结果准确,即使是无序数据或者延迟达到的数据
  2. 有状态以及容错,维护精准一次应用状态
  3. 大规模计算,几千台节点运算,高吞吐和低延迟的特点
  4. flink通过检查机制实现精准一次的计算保证,在故障时可以提现出来。
  5. flink支持流计算以及窗口化操作
  6. flink灵活的基础时间的窗口计算
  7. flink容错是轻量级的,保证零数据丢失

4、flink-流计算模型、有界数据集处理

  1. 有界数据集是无界数据集的一个特例
  2. 有界数据集在flink内部是以一种终态数据集进行处理的。
  3. 在flink中,有界和无界的差别非常小。
  4. 使用同一套流计算执行引擎上的API操作两种数据类型。

总结:

开源流计算引擎,消除了性能和可靠性的权衡,鱼和熊掌可以兼得

发布了216 篇原创文章 · 获赞 20 · 访问量 1万+

猜你喜欢

转载自blog.csdn.net/weixin_39868387/article/details/104661965