Zookeeper入门介绍学习笔记

一、什么是Zookeeper

Zookeeper是一个高可用的分布式管理与协调框架，基于ZAB算法（原子消息广播协议）实现。ZK能够很好的保证分布式环境下的数据一致性，这一特性使得ZK是处理分布式一致性问题的利器。可以基于它实现发布订阅、负载均衡、命名服务、协调通知、集群管理、master选举、分布式锁和分布式队列的特性

1.1 原理

ZooKeeper是以Fast Paxos算法为基础的，Paxos 算法存在活锁的问题，即当有多个proposer交错提交时，有可能互相排斥导致没有一个proposer能提交成功，而Fast Paxos作了一些优化，通过选举产生一个leader (领导者)，只有leader才能提交proposer。

1.2 特性

可靠性：一旦Zookeeper成功的应用了一个事务，并完成对client的响应，那么Zookeeper内部集群的所有服务器的状态都会是一致的保留下来。
单一视图：由于上面可靠性的保证，使得无论client连接的是ZK集群中的哪个服务器，所看到的数据都是一致的。
顺序一致性：从一个client发起的请求，最终会严格的按照发起的顺序被应用到Zookeeper中去。【实质上，ZK会对每一个client的每一个请求，进行编号，说白了，就是分配一个全局唯一的递增编号，这个编号反映了所有事务操作的先后顺序。】
实时性：通常意义下的实时性是指一旦事务被成功应用，那么client会立刻从服务器端获取到变更后的新数据。ZK仅仅能够保证在一定时间内，client最终一定会能从服务器上获取到最新的数据。
高可用：在ZK集群内部，会有一个Leader，多个Follower。一旦Leader挂掉，那么ZK会通过Paxos算法选举出新的Leader，只要ZK集群内部的服务器有一半以上正常工作，那么ZK就能对外正常提供服务！
简单的数据结构：类似于Linux文件系统的树形结构，简单，实用！（树形层次空间）
高性能：性能有多高呢，举个栗子，比如我们经常通过创建临时节点来处理分布式锁，要知道临时节点是存储在内存中的，在读场景压力测试下，QPS高达10W+！也就是说ZK在读场景下，性能非常突出！

1.3 zookeeper的数据模型

在这里插入图片描述

每一个节点被称为znode，znode可以有子节点目录，并且每个znode可以存储数据（特别需要注意的是临时节点不可以有子节点）
znode如果是临时节点，意味着创建这个znode的client一旦与ZK集群失去联系，这个临时的znode将被自动删除。（事实上，client与ZK通信是采用长连接方式，并通过心跳的方式保持连接，这种状态就是session，一旦session失效，就是连接断开，临时节点会被删除掉）
znode是可以被监控的，不论是znode本身的数据变化，还是该znode下的子节点的变化，都可以进行监控，这也是ZK的核心特性。

1.4 Zookeeper的组成

Leader：负责客户端的write类型的请求
Follower：负责客户端的read类型请求，并可以参与Leader的选举
Observer/watcher: 特殊的Follower,与Follower统称为Learner

1.5 应用场景

配置管理

集群管理
发布与订阅
数据库切换
分布式日志收集
分布式锁、队列管理等
……

更多详细>>

1.6 其他

ZAB算法（原子消息广播协议）
Paxos 算法

Paxos算法详细图解

参考学习文章

分布式利器Zookeeper