[工作笔记] FLINK-10333 Rethink ZooKeeper based stores - 代码天地

[工作笔记] FLINK-10333 Rethink ZooKeeper based stores

其他 2018-12-09 07:44:43 阅读次数: 0

目前 Dispatcher 在收到 JobManagerRunner 完成 Job 的消息后会去调用 JobManagerRunner#closeAsync，随后清理 SubmittedJobGraphStore
在不考虑 RunningJobsRegistry 的情况下的由于这个过程不是原子的，所以有可能

在清理 SubmittedJobGraphStore 之前 Dispatcher 挂了，重启的 Dispatcher 从 SubmittedJobGraphStore 中恢复 JobGraph，又去执行已经完成的 Job
在 JobManagerRunner#closeAsync 过程中，原来的 JobManagerRunner 放弃 leadership，但是还未关闭 LeaderElectionService，此时新的 JobManagerRunner 起来又去执行已经完成的 Job

目前通过 JobManagerRunner 在完成任务时往 RunningJobsRegistry 写 JobSchedulingStatus#DONE 来拦住这两个行为，但是 RunningJobsRegistry 最终却是由 Dispatcher 来清理的，这样就把一个数据结构的管理职责分散给了两个角色。究其原因是因为 Job 的状态原本应该由 Dispatcher 来 commit 和发布，现在却以 JobManagerRunner 的状态为准。解决这种职责混乱的方法可以是让 Dispatcher 来负责 Job 状态的发布，并在 Dispatcher 端原子化 Job 的 commit 和 SubmittedJobGraphStore 的清理工作，同时在此时阻止新的 JobId 相同的 JobManagerRunner 的启动

(tison, 2018-12-09)

猜你喜欢

转载自www.cnblogs.com/tisonkun/p/10089987.html

[工作笔记] FLINK-10333 Rethink ZooKeeper based stores

Dostoevsky: Better Space-Time Trade-Offs for LSM-Tree Based Key-Value Stores via Adaptive Removal of Superfluous Merging 阅读笔记

Mac系统mds、mds_stores、mdworker疯狂工作的问题

实习记——《Rethink》

大数据_Flink_Java版_状态管理(2)_算子状态---Flink工作笔记0061

大数据_Flink_Java版_状态管理(3)_键控状态---Flink工作笔记0062

大数据_Flink_Java版_状态管理(4)_状态后端---Flink工作笔记0065

大数据_Flink_Java版_并行任务WaterMark传递测试---Flink工作笔记0064

Lesson 9: Job Stores

大数据_Flink_Java版_数据处理_Watermark(7)在代码中的设置---Flink工作笔记0055

大数据_Flink_Java版_数据处理_Watermark(7)_的设定原则---Flink工作笔记0056

大数据_Flink_Java版_数据处理_时间语义(2)_时间语义的应用---Flink工作笔记0050

大数据_Flink_Java版_数据处理_Watermark_概念和原理---Flink工作笔记0052

大数据_Flink_Java版_数据处理_Watermark在任务间的传递---Flink工作笔记0054

大数据_Flink_Java版_数据处理_状态管理_状态的定义---Flink工作笔记0060

大数据_Flink_Java版_状态编程_温度跳变报警---Flink工作笔记0063

大数据_Flink_Java版_数据处理_时间语义(1)_时间语义概念---Flink工作笔记0049

大数据_Flink_Java版_数据处理_Watermark_特点和行为---Flink工作笔记0053

ZooKeeper笔记

ZooKeeper 笔记

Zookeeper+Kafka+flink

工作笔记

工作笔记(2)

mysql工作笔记

EAS工作笔记

日常工作笔记

工作笔记2

各种工作笔记

201807工作笔记

2016.2.26 工作笔记

今日推荐

周排行

LRU cache算法

windows10, 自带的OpenSSH, key权限问题, 文件权限问题

测试用例书写方法

HIVE-默认分隔符的（linux系统的特殊字符）查看，输入和修改

最贵的AMD 7nm显卡来了！这设计够狂野

java多线程简单demo

[ 转载 ]在Android系统上使用busybox——最简单的方法

QT connect学习

BFSIFT算法分析

Xcode10：library not found for -lstdc++.6.0.9 临时解决

每日归档

更多

2024-08-06(0)

2024-08-05(0)

2024-08-04(0)

2024-08-03(0)

2024-08-02(0)

2024-08-01(0)

2024-07-31(0)

2024-07-30(0)

2024-07-29(0)

2024-07-28(0)