一、初始MHA
MHA(Master High Availability)在MySQL故障切换过程中,MHA能做到在0~30秒之内自动完成数据库的故障切换操作,并且在进行故障切换的过程中,MHA能在最大程度上保证数据的一致性,以达到真正意义上的高可用。
该软件由两部分组成:MHA Manager(管理节点)和MHA Node(数据节点)。MHA Manager可以单独部署在一台独立的机器上管理多个master-slave集群,也可以部署在一台slave节点上。MHA Node运行在每台MySQL服务器上,MHA Manager会定时探测集群中的master节点,当master出现故障时,它可以自动将最新数据的slave提升为新的master,然后将所有其他的slave重新指向新的master。整个故障转移过程对应用程序完全透明。
在MHA自动故障切换过程中,MHA试图从宕机的主服务器上保存二进制日志,最大程度的保证数据的不丢失,但这并不总是可行的。例如,如果主服务器硬件故障或无法通过ssh访问,MHA没法保存二进制日志,只进行故障转移而丢失了最新的数据。使用MySQL 5.5的半同步复制,可以大大降低数据丢失的风险。MHA可以与半同步复制结合起来。如果只有一个slave已经收到了最新的二进制日志,MHA可以将最新的二进制日志应用于其他所有的slave服务器上,因此可以保证所有节点的数据一致性。
MHA工作原理总结为如下:
1从宕机崩溃的master保存二进制日志事件(binlog events);
2识别含有最新更新的slave;
3应用差异的中继日志(relay log)到其他的slave;
4应用从master保存的二进制日志事件(binlog events);
5提升一个slave为新的master;
6使其他的slave连接新的master进行复制;
二、高可用配置
实验环境:
Server1:mysql master
Server2:mysql Candicate slave
Server3:mysql slave
Server4:MHA管理节点
1.安装数据库(server1,2,3)
以server3为例:
[root@server3 ~]# tar xf mysql-5.7.17-1.el6.x86_64.rpm-bundle.tar
[root@server3 ~]# yum install -y mysql-community-client-5.7.17-1.el6.x86_64.rpm mysql-community-common-5.7.17-1.el6.x86_64.rpm mysql-community-libs-5.7.17-1.el6.x86_64.rpm mysql-community-libs-compat-5.7.17-1.el6.x86_64.rpm mysql-community-server-5.7.17-1.el6.x86_64.rpm
[root@server3 ~]# vim /etc/my.cnf
server-id=3 #各主机对应设置,不可重复
log-bin=mysql-bin
[root@server3 ~]# /etc/init.d/mysqld restart
[root@server3 ~]# cat /var/log/mysqld.log |grep password
[root@server3 ~]# mysql_secure_installation ##修改密码
2.搭建主从复制
在master授权用户:
mysql> grant replication slave on *.* to repl@'172.25.7.%' identified by 'Hello007=';
在slave测试:
[root@server2 ~]# mysql -u repl -p -h 172.25.62.1
[root@server3 ~]# mysql -u repl -p -h 172.25.62.1
均ok
在server1查看master状态:
在server3、4进行链接
mysql> change master to master_host='172.25.62.1',master_user='repl',master_password='Hello007=',master_log_file='mysql-bin.000001',master_log_pos=154;
Query OK, 0 rows affected, 2 warnings (0.70 sec)
mysql> start slave;
Query OK, 0 rows affected (0.28 sec)
mysql> show slave status\G;
Slave_IO_Running: Yes
Slave_SQL_Running: Yes
3.SSH无密码链接:
MHA manager 通过 SSH 访问所有的 node 节点,各个 node 节点也同样需要通过 SSH 来相互发送不同的 relay log文件,所以有必要在每一个node和manager上配置SSH无密码登陆
[root@server4 ~]# ssh-keygen
将公钥和私钥分发给123
[root@server4 ~]# scp .ssh/id_rsa .ssh/id_rsa.pub server2:/root/.ssh/
[root@server4 ~]# scp .ssh/id_rsa .ssh/id_rsa.pub server3:/root/.ssh/
[root@server4 ~]# scp .ssh/id_rsa .ssh/id_rsa.pub server1:/root/.ssh/
添加key认证方式:
在server1,2,3都执行
[root@server2 ~]# ssh-copy-id -i /root/.ssh/id_rsa.pub [email protected]
4.安装MHA
Mha节点四个主机都要安装:
[root@server1 MHA]# yum install -y mha4mysql-node-0.56-0.el6.noarch.rpm
Mha管理:
解决依赖性:
[root@server1 MHA]# yum install -y perl-Config-Tiny-2.12-7.1.el6.noarch.rpm perl-Email-Date-Format-1.002-5.el6.noarch.rpm perl-Log-Dispatch-2.27-1.el6.noarch.rpm perl-Mail-Sender-0.8.16-3.el6.noarch.rpm perl-Mail-Sendmail-0.79-12.el6.noarch.rpm perl-MIME-Lite-3.027-2.el6.noarch.rpm perl-MIME-Types-1.28-2.el6.noarch.rpm perl-Parallel-ForkManager-0.7.9-1.el6.noarch.rpm
[root@server1 MHA]# yum install mha4mysql-manager-0.56-0.el6.noarch.rpm -y
5.slave节点配置
在server2和server3配置relay log的清除方式和slave配置只读,但不要写入配置文件,因为master机down掉后可能随时会升级成master:
mysql> set global relay_log_purge=0;
Query OK, 0 rows affected (0.00 sec)
mysql> set global read_only=on;
Query OK, 0 rows affected (0.00 sec)
6.编写mha管理文件
[root@server4 masterha]# vim app.cnf
[server default]
manager_log=/etc/masterha/mha.log
manager_workdir=/etc/masterha/
master_binlog_dir=/var/lib/mysql
#master_ip_online_change_script=/etc/masterha/master_ip_online_change
password=Hello007=
ping_interval=1
remote_workdir=/tmp
repl_password=Hello007=
repl_user=repl
ssh_user=root
user=root
[server1]
hostname=172.25.62.1
port=3306
[server2]
candidate_master=1
check_repl_delay=0
hostname=172.25.62.2
port=3306
[server3]
hostname=172.25.62.3
port=3306
检查ssh链接
[root@server4 ~]# masterha_check_ssh --conf=/etc/masterha/app1.cnf
检测repl环境
[root@server4 masterha]# masterha_check_repl --conf=/etc/masterha/app.cnf
在master上:
mysql> grant all on *.* to root@'172.25.62.%' identified by 'Hello007=';
Query OK, 0 rows affected, 1 warning (0.13 sec)
再次检测repl环境:
开启MHA监控模式:
[root@server4 masterha]# nohup masterha_manager --conf=/etc/masterha/app.cnf &
[1] 1348
[root@server4 masterha]# nohup: ignoring input and appending output to `nohup.out'
测试:
[root@server1 ~]# /etc/init.d/mysqld stop
查看server4的日志
[root@server4 masterha]# cat mha.log