单机模式
官网下载后解压,更改conf目录下zoo_sample.cfg为zoo.cfg,打开zoo.cfg,修改dataDir
clientPort=2181 #默认端口号,无需修改
dataDir=/opt/zookeeper-3.4.10/zkData #按实际路径写,一般放在安装目录下,zkData不存在需要先创建
进入bin目录,启动zookeeper
#其他命令
./zkServer.sh status #查看状态
./zkServer.sh stop #停止
./zkServer.sh restart #重启
./zkServer.sh start /zoo.cfg #指定配置文件启动,默认是加载onf/zoo.cfg
伪集群模式
因为没有那么多服务器,现在模拟在一台服务器创建集群,步骤如下:
1. 解压zookeeper到三个目录,取名为zookeeper-01、zookeeper-02、zookeeper-03
2. 按照单机版操作方式分别创建zkData、zoo.cfg,分行更改端口号为2181、2182、2183
3. 分别在zkData目录下创建myid文件,为myid文件设置不一样的值,这里我们分别设置为1、2、3
4. 分别为zoo.cfg添加集群信息
server.1=127.0.0.1:28881:38881
server.2=127.0.0.1:28882:38882
server.3=127.0.0.1:28883:38883
#server.1表示zookeeper-01中myid文件中的值
#127.0.0.1表示zookeeper-01的ip地址
#28881表示zookeeper-01收发副本数据的通信端口
#38881表示zookeeper-01选举投票时的通信端口
5. 启动集群,按照单机版的启动方法,分别启动zookeeper,启动后查看状态
zoo.cfg配置参数
clientPort=2181 #端口号
dataDir=/tmp/zookeeper #数据保存目录
#dataLogDir= 日志保存目录,默认为dataDir目录下
tickTime=2000 #心跳间隔时间,毫秒
initLimit=10 #初始化心跳个数,当Zookeeper服务器集群启动时,Leader(主机)与Follower(从机)通信超过initLimit*tickTime秒后,则认定连接失败
syncLimit=5 #同步心跳个数, 当Zookeeper服务器集群启动后,Leader(主机)与Follower(从机)通信超过syncLimit*tickTime秒后,则认定连接失败
clientPort=2181 #Zookeeper服务器的端口号
选举机制
1)半数机制:集群中半数以上机器存活,集群可用。所以Zookeeper适合安装奇数台服务器,至少三台。
2)Zookeeper虽然在配置文件中并没有指定Master和Slave。但是,Zookeeper工作时,是有一个节点为Leader,其他则为Follower,Leader是通过内部的选举机制临时产生的。
3)以一个简单的例子来说明整个选举的过程。
假设有五台服务器组成的Zookeeper集群,它们的id从1-5,同时它们都是最新启动的,也就是没有历史数据,在存放数据量这一点上,都是一样的。假设这些服务器依序启动,来看看会发生什么,如图所示。
(1)服务器1启动,此时只有它一台服务器启动了,它发出去的报文没有任何响应,所以它的选举状态一直是LOOKING状态。
(2)服务器2启动,它与最开始启动的服务器1进行通信,互相交换自己的选举结果,由于两者都没有历史数据,所以id值较大的服务器2胜出,但是由于没有达到超过半数以上的服务器都同意选举它(这个例子中的半数以上是3),所以服务器1、2还是继续保持LOOKING状态。
(3)服务器3启动,根据前面的理论分析,服务器3成为服务器1、2、3中的老大,而与上面不同的是,此时有三台服务器选举了它,所以它成为了这次选举的Leader。
(4)服务器4启动,根据前面的分析,理论上服务器4应该是服务器1、2、3、4中最大的,但是由于前面已经有半数以上的服务器选举了服务器3,所以它只能接收当小弟的命了。
(5)服务器5启动,同4一样当小弟。