1.概述
随手记录一下
checkpoint的内容一般如下
上图中我们看到三行,表示三个 operator,其中每一列的含义分别如下:
- 其中 Acknowledged 一列表示有多少个 subtask 对这个 Checkpoint 进行了 ack,从图中我们可以知道第三个 operator 总共有 5 个 subtask,但是只有 4 个进行了 ack;
- 第二列 Latest Acknowledgement 表示该 operator 的所有 subtask 最后 ack 的时间;
- End to End Duration 表示整个 operator 的所有 subtask 中完成 snapshot 的最长时间;
- State Size 表示当前 Checkpoint 的 state 大小 – 主要这里如果是增量 checkpoint 的话,则表示增量大小;
- Buffered During Alignment 表示在 barrier 对齐阶段积攒了多少数据,如果这个数据过大也间接表示对齐比较慢);