异步复制是什么
MySQL 默认的复制即是异步的,主库在执行完客户端提交的事务后会立即将结果返给给客户端,并不关心从库是否已经接收并处理,这样就会有一个问题,主如果 crash 掉了,此时主上已经提交的事务可能并没有传到从上,如果此时,强行将从提升为主,可能导致新主上的数据不完整。
全同步复制
(Fully synchronous replication)
指当主库执行完一个事务,所有的从库都执行了该事务才返回给客户端。因为需要等待所有从库执行完该事务才能返回,所以全同步复制的性能必然会收到严重的影响。
半同步复制
(Semisynchronous replication)
介于异步复制和全同步复制之间,主库在执行完客户端提交的事务后不是立刻返回给客户端,而是等待至少一个从库接收到并写到 relay log 中才返回给客户端。相对于异步复制,半同步复制提高了数据的安全性,同时它也造成了一定程度的延迟,这个延迟最少是一个 TCP/IP 往返的时间。所以,半同步复制最好在低延时的网络中使用。
在 2010 年 MySQL 5.5 版本之前,一直采用的是这种异步复制的方式。主库的事务执行不会管备库的同步进度,如果备库落后,主库不幸 crash,那么就会导致数据丢失。于是在 MySQL 在 5.5 中就顺其自然地引入了半同步复制,主库在应答客户端提交的事务前需要保证至少一个从库接收并写到 relay log 中。
相比异步复制,半同步复制提高了数据完整性,因为很明确知道,在一个事务提交成功之后,这个事务就至少会存在于两个地方。即在 master 的 dumper 线程通知 slave 后,增加了一个 ack(消息确认),即是否成功收到 t1 的标志码,也就是 dumper 线程除了发送 t1(事务一)到 slave,还承担了接收 slave 的 ack 工作。如果出现异常,没有收到 ack,那么将自动降级为普通的复制(异步),直到异常修复后又会自动变为半同步复制。
半同步的实现步骤
半同步实现的前提是主从复制实现成功,我之前已经做了基于GTID的主从复制。这里不再赘述。
实验背景:
server1 主数据库 172.25.2.10
server2 备数据库 172.25.2.11
关闭两台主机的防火墙和selinux
1.在主库上(server1)安装插件
INSTALL PLUGIN rpl_semi_sync_master SONAME 'semisync_master.so';
2.查看插件是否安装
SELECT PLUGIN_NAME, PLUGIN_STATUS FROM
INFORMATION_SCHEMA.PLUGINS WHERE PLUGIN_NAME LIKE '%semi%';
3.激活插件
SET GLOBAL rpl_semi_sync_master_enabled =1;
4.在 slave 节点上(server2)也安装插件
INSTALL PLUGIN rpl_semi_sync_slave SONAME 'semisync_slave.so';
5.激活插件
SET GLOBAL rpl_semi_sync_slave_enabled =1;
6.在serevr2(从)重启 IO 线程使半同步生效
7.在 master 节点上查看
show status like '%rpl%';
ON 表示已开启
show variables like '%rpl%';
rpl_stop_slave_timeout | 31536000 #控制 stop slave 的执行时间,
在重放一个大的事务的时候,突然执行stop slave,命令 stop slave会执行很久,
这个时候可能产生死锁或阻塞, 严重影响性能
https://dev.mysql.com/doc/refman/5.6/en/server-system-variables.html
#具体参数可以看官方文档默认延迟 10s
8.在 slave 节点上查看
show variables like '%rpl%';
9.停止 slave 上的 io 线程再测试
STOP SLAVE IO_THREAD;
10.在master 上插入数据
等待 10s 才插入成功,因为上面超时时间是 10s,10s 后如果没有收到 slave 节点的返回,就会切换到异步复制
11.在slave上没有找到插入的数据
12.在master上查看半同步状态是 off,待同步的事务也是 1
再次插入时就不会延迟,因为已经是异步了
13.slave 上开启 io 线程
查看进程,;输出结果显示了有哪些线程在运行
id 列:一个标识
user 列: 显示当前用户,如果不是 root,这个命令就只显示你权限范围内的 sql 语句
host 列:显示这个语句是从哪个 ip 的哪个端口上发出的。可用来追踪出问题语句的用户
db 列:显示这个进程目前连接的是哪个数据库
command 列:显示当前连接的执行的命令,一般就是休眠(sleep),查询(query),连接(connect)
time 列:此这个状态持续的时间,单位是秒
state 列:显示使用当前连接的 sql 语句的状态
14.在slave查看表信息,已经复制过来
15.master 上查看进程