Corosync+pacemaker实现集群的高可用 - 代码天地

Corosync+pacemaker实现集群的高可用

其他 2018-09-23 22:37:31 阅读次数: 0

一、Corosync和pacemaker的了解：

Corosync是集群管理套件的一部分，他在传递信息的时候可以通过一个简单的配置文件来定义信息传递的方式和协议等。也就是说，corosync是Messaging Layer集群信息层软件，需要pacemaker资源管理器，才能构成一个完整的高可用集群。它也是运行于心跳层的开源软件。（是集群框架引擎程序）

Pacemaker也就是Cluster Resource Manager（简称CRM），，是一个集群资源管理器。它利用群集基础构建（corosync或heartbeat）提供的消息和成员管理能力来探测并从节点或资源级别的故障中恢复，以实现群集服务的最大可用性。

Pacemaker和corosync，前者用于资源的转移，后者用于心跳的检测。结合起来使用，实现对高可用架构的自动管理。心跳检测使用来检测服务器是否还在提供服务，若出现服务器异常，就认为它挂掉了，此时pacemaker将会对资源进行转移。

Crmsh是pacemaker的命令行工具。

二、高可用集群的配置（实现环境：关闭selinux和火墙）

主要实现的是，在server1和server4上安装corosync和pacemaker，当一个节点服务器出问题，则另一个节点服务器进行服务。

1）在server1和server4中安装pacemaker和corosync

---> yum install pacemaker corosync -y

2）在server1中配置corosync的配置文件，完成后复制到server4中

---> cp /etc/corosync/corosync.conf.example /etc/corosync/corosync.conf

---> vim /etc/corosync/corosync.conf #修改内容如下

# Please read the corosync.conf.5 manual page

compatibility: whitetank

totem {
          version: 2          # 表示配置文件的版本
          secauth: off        # 表示集群认证关闭
          threads: 0          # 并发开启的线程数
          interface {         # 接口信息
                  ringnumber: 0
                  bindnetaddr: 172.25.2.0              # 集群工作的网段
                  mcastaddr: 226.94.1.1                # 多播地址
                  mcastport: 5405                      # 多播端口号（注意，在多个人使用时，修改自己的端口号或多播地址，防止结点添加在自己的集群中）
                  ttl: 1
          }
}
logging {       # 配置日志存储部分
        fileline: off
          to_stderr: no
      to_logfile: yes
          to_syslog: yes
      logfile: /var/log/cluster/corosync.log
      debug: off

      timestamp: on
      logger_subsys {
                  subsys: AMF
                  debug: off
          }
}

amf {
      mode: disabled
}
service {       # 启动corosync之后启动pacemaker；若var为1的时候，需要手动启动pacemaker
        name: pacemaker
          ver: 0
}

---> scp /etc/corosync/corosync.conf server4:/etc/corosync/corosync.conf

3）在server1和server4中安装crm软件(软件包需要在网上下载)

---> yum install -y crmsh-1.2.6.0.rc2.2.1.x86_64.rpm pssh-2.3.1-4.1.x86_64.rpm

4)开启服务 (server1和server4均需要启动)

---> /etc/init.d/corosync start # 当corosync启动后，pacemaker也会启动

5）检测crm(出现结点1和结点4，代表结点添加成功)

6）两个节点均crm_verify -VL 校验（会出现如下提示信息)

---> crm_verify -LV

# 出现错误时，我们可以设置STONITH的值，消除错误（Stonith 即shoot the other node in the head使Heartbeat软件包的一部分，该组件允许系统自动地复位一个失败的服务器使用连接到一个健康的服务器的遥远电源设备。 Stonith设备是一种能够自动关闭电源来响应软件命令的设备）

7)我们在server4中添加策略(ip和apache)，在server1中进行监控

# 首先添加vip （完成之后，可以在server1的监控中看到）

# 添加参数，当结点server1坏掉的时候，server4会自动接管（也相当于忽略结点的检测）

在server1中执行 /etc/init.d/corosync stop后，在server4中监控结果为：

# 添加spache服务在集群中(警告：默认时间和自己设置的监控时间不同，忽略，它会以默认时间为准)；但此时cpahce和vip不在同一主机上，需建立资源组，把vip和apache服务添加进去;(注意，添加进去的服务不需要手动启动，pacamaker会帮我们启动)

此时，server4中监控的情况为

7）此时，apache的高可用已经配置完成，我们可以进行测试。当运行的节点有问题时，会http会自动切换到另一个节点上。

# 修改node1为standy（停止节点node1），此时浏览器中显示的server4

三、含fence设备的高可用实现

在server1和server4中查看，是否有key文件。

1)在真机中安装软件

---> yum search fence-cirtd #查找相关软件

---> yum install -y yum install -y fence-virtd-libvirt.x86_64 fence-virtd-multicast.x86_64 fence-virtd.x86_64

---> mkdir /etc/cluster # 创建密码生成目录

---> cd /etc/cluster

---> fence_virtd -c # 生成配置文件

Module search path [/usr/lib64/fence-virt]: 回车

Available backends:
      libvirt 0.1
Available listeners:
multicast 1.2

Listener modules are responsible for accepting requests
from fencing clients.

Listener module [multicast]: 回车（默认为多播）

The multicast listener module is designed for use environments
where the guests and hosts may communicate over a network using
multicast.

The multicast address is the address that a client will use to
send fencing requests to fence_virtd.

Multicast IP Address [225.0.0.12]: 回车（多播ip）

Using ipv4 as family.

Multicast IP Port [1229]: 回车（多播接口）

Setting a preferred interface causes fence_virtd to listen only
on that interface. Normally, it listens on all interfaces.
In environments where the virtual machines are using the host
machine as a gateway, this *must* be set (typically to virbr0).
Set to 'none' for no interface.

Interface [br0]: 回车（此处为自己真机的ip设备名称）

The key file is the shared key information which is used to
authenticate fencing requests. The contents of this file must
be distributed to each physical host and virtual machine within
a cluster.

Key File [/etc/cluster/fence_xvm.key]: 回车（密钥位置，没有目录自己建立）

Backend modules are responsible for routing requests to
the appropriate hypervisor or management layer.

Backend module [libvirt]:

Configuration complete.

=== Begin Configuration ===
fence_virtd {
listener = "multicast";
      backend = "libvirt";
      module_path = "/usr/lib64/fence-virt";
}

listeners {
multicast {
      key_file = "/etc/cluster/fence_xvm.key";
      address = "225.0.0.12";
          interface = "br0";
          family = "ipv4";
          port = "1229";
      }

}

backends {
libvirt {
          uri = "qemu:///system";
      }
}

=== End Configuration ===
Replace /etc/fence_virt.conf with the above [y/N]? y（对配置进行覆盖保存）

---> dd if=/dev/urandom of=fence_xvm.key bs=128 count=1 # 随机截取密码文件的大小

---> systemctl start fence-virtd.service # 启动服务（要关闭火墙）

2）将真机中生成的密钥发送给server1和server4

---> scp /etc/cluster/fence_xvm.key server1:/etc/cluster # 若在server1或4中没有cluster目录。创建即可

---> scp /etc/cluster/fence_xvm.key server4:/etc/cluster

3)在server1和server4中执行stonith_admin -l,查看是否有fence代理：fence_xvm。如果没有我们需要安装fence-virt-0.2.3-15.el6.x86_64,

---> yum install fence-virt-0.2.3-15.el6.x86_64 -y

4)在corosync的策略中添加fence（当节点有问题时，可以自启动）

crm(live)configure# primitive vmfence stonith:fence_xvm params pamk_host_map="server1:vm1;server4:vm4" op monitor interval=1min

4)在另一端监控情况如下：

5)测试，此时当我们对虚拟机server4使用命令---> echo c> /proc/sysrq-trigger 的时候，它会自动重启，并添加在可用节点里面。

注意：当添加vmfence时，出现 vmfence_start_0 on server1 'unknown error' (1)错误的时候，我们可以进行如下操作：(对之前的数据进行清除)

猜你喜欢

转载自www.cnblogs.com/uthnb/p/9692084.html

Corosync+pacemaker实现集群的高可用

HAProxy实现负载均衡及高可用集群（corosync+pacemaker）

corosync+pacemaker部署高可用集群

Corosync+Pacemaker构建高可用集群

corosync+pacemaker配置高可用集群

corosync+pacemaker 实现高可用的群集

Corosync+Pacemaker高可用集群构建过程详解

corosync+pacemaker使用crmsh构建高可用集群

corosync+pacemaker高可用部署

pacemaker+corosync实现高可用集群

corosync + pacemaker实现集群的高可用

pacemaker+corosync集群实现高可用

corosync+pacemaker配置高可用集群（需要额外安装crm工具）

Linux高可用之Corosync+Pacemaker详解

pacemaker + corosync 实现高可用

使用corosync + pacemaker + crmsh实现nginx的高可用集群

企业级 ##pacemaker+corosync集群实现高可用##

Pacemaker + Corosync 集群高可用的实现（Fence、nfs共享存储）

搭建Pacemaker + Corosync高可用集群

corosync pacemaker 配置高可用集群（二）

corosync pacemaker 配置高可用集群（一）

Linux：corosync + pacemaker高可用集群

corosync+pacemaker+crmsh高可用集群

PG数据库实现高可用方案（包括通用型方案Corosync+pacemaker协作）

corosync 和 pacemaker实现高可用

haproxy+pacemaker+corosync实现高可用

高可用集群（1）- Pacemaker+Corosync实现负载均衡和高可用

Corosync+pacemaker高可用解决方案（无坑，解决大多说问题）

基于Corosync+Pacemaker+DRBD+LNMP实现Web服务器高可用集群

mfs+pacemaker+pcs+corosync+iscsi+fence实现mfs的集群管理，高可用等

今日推荐

周排行

深度学习------Lingvo框架下的加速通道GPipe

webjars管理静态资源

C专家编程_2.2

mysql 源码安装

json文件操作

123231432

注解的实现

Spring MVC 控制器

《人月神话》读后感二

C#使用HttpWebRequest和HttpWebResponse上传文件示例

每日归档

更多

2024-09-08(0)

2024-09-07(0)

2024-09-06(0)

2024-09-05(0)

2024-09-04(0)

2024-09-03(0)

2024-09-02(0)

2024-09-01(0)

2024-08-31(0)

2024-08-30(0)