heartbeat+DRBD高可用笔记

1.heartbeat提供高可用,一台宕机另一台接管。

2.心跳线尽量使用串口或者直连线,否则可能发生裂脑情况,双方同时接不到心跳,同时启服务器和VIP。

3.防止裂脑发生的办法:

    多条心跳线,使用stonith设备强行杀死主节点(断电),对裂脑进行监控报警人工再去处理,磁盘锁,接管时间设置比较长给人上去查看是否裂脑留时间,增加仲裁机制。

4.裂脑告警只需查看备机的VIP出现即可,出现VIP不是正常接管就是裂脑

5.HA.cf配置文件:

debugfile /var/log/ha-debug

logfile /var/log/ha-log

logfacility local1

keepalive 2

deadtime 30

warntime 10

initdead 60

#bcast eth1

mcast eth2 225.0.0.7 694 1 0

auto_failback off

node data-1-1

node data-1-2

crm no

5.配置别名IP:

   ifconfig eth0:0 172.16.1.252 netmask 255.255.255.0 (即将淘汰)

   ip addr add 172.16.1.23/24 dev eth0

   ip addr del 172.16.1.23/24 dev eth0 (删除别名)

6.资源生效顺序:从左到右

7.让heartbeat执行Drbd的自动切换角色,并且挂载drbd磁盘到datab,并且添加VIP,重新挂载客户端NFS:

SH_T_nfs_01 drbddisk::data Filesystem::/dev/drbd0::/data::ext4 IPaddr::172.16.1.227/24/eth0 remount-nfs (配置DRBD是主,挂载并且切换VIP)

------------------DRBD------------------------------------

1.异步同步:

A模式:写入成功主设备发送到本端TCP返回成功

B模式:写入成功主设备发送到对端TCP返回成功

2.实时同步:C模式,主备设备需要全部写入成功才返回成功(公司一般选这项,数据最安全)

3.裂脑后人工处理办法:

  在选定的非主节点上执行:

  drbdadm secondary data (更新备节点位状态)   drbdadm disconnect data  (断开连接)   drbdadm -- --discard-my-data connect data (放弃本地更新数据进行连接)
  主节点上执行: (查看如果不是WFC)    drbdadm disconnect data  (断开连接)
   drbdadm connect data (主节点进行连接) 4.大于16TB的磁盘分区:用XFS或者e2fsprogs分区。 5.大于2T的磁盘用parted分区:     parted /dev/sdb mklabel gpt yes   (初始化分区表)

猜你喜欢

转载自2002wmj.iteye.com/blog/2294724