一、企业群集应用概述
1.1 群集的含义
- Cluster,集群、群集
- 由多台主机构成,但对外只表现为一个整体
1.2 问题
- 物联网应用中,随着站点对硬件性能、响应速度、服务稳定性、数据可靠性等要求越来越高,单台服务器力不从心
1.3 解决方法
- 使用价格昂贵的小型机、大型机
- 使用普通服务器构建服务群集
二、企业群集分类
2.1根据群集所针对的目标差异,功能上可分为三种类型
- 负载均衡群集
◆ 进行健康状态检查,管理调度 - 高可用群集
◆ 两个负载均衡服务器,实现高可用,即使有一个负载均衡服务器挂了,也依旧可用,也有可靠性,;两台服务器地理位置不一定在一起,也可以一台在北京,一个在南京 - 高性能运算群集
◆ 一个大的服务请求过来,单个处理30分钟的,被分派到下面各个节点,减少时间
2.2 负载均衡群集(Load Balance Cluster)
- 提高应用系统的响应能力、尽可能处理更过的访问请求、减少延迟为目标,获得高并发、高负载(LB)的整体性能
- LB的负载分配依赖于主节点的分流算法(分流算法就是调度算法)
2.3 高可用群集(High Availability Cluster)
- 提高应用系统的可靠性、尽可能地减少中断时间为目标,确保服务的连续性达到高可用(HA)的容错效果
◆ HA 就是高可用的意思,群集可以支持高可用 - HA的工作方式包括双工和主从两种模式
◆ 双工就是两台服务器都处于工作状态,去中心化的群集机制,属于平级,接收到的信息都可以处理;去中心化机制实例:比如说redis
◆ 主从是中心化群集,有一个是master,其他的都是从服务器,用来做备份
2.4 高性能运算群集(High Performance Computer Cluster)
- 以提高应用系统的CPU运算速度、扩展硬件资源和分析能力为目标,获得相当于大型、超级计算机的高性能运算(HPC)能力
- 高性能运算群集的高性能依赖于“分布式运算”、“并行计算”,通过专用硬件和软件将多个服务器的CPU、内存等资源整合在一起,实现只有大型、超级计算机才具备的计算能力
◆ 把普通服务器整合起来,获得相当于超级计算机的高级别算力
◆ 算力:CPU,GPU,主板芯片,带宽,可以优化计算机运行速度的,都在算力的考虑内
三、负载均衡群集架构
3.1 负载均衡的结构
- 第一层,负载调度器(Load Balancer或Director)
- 第二层,服务器池(Server Pool)
- 第三层,共享存储(Share Storage)
四、负载均衡群集工作模式分析
- 负载均衡群集是目前企业用得最多的群集类型
- 群集的负载调度技术有三种工作模式
◆ 地址转换——NAT模式
◆ IP隧道
◆ 直接路由——DR 模式
4.1 NAT模式——地址转换
- Network Address Translation,简称NAT模式
- 类似防火墙的私有网络结构,负载调度器作为所有服务器节点的网管,即作为客户机的访问入口,也是各节点回应客户机的访问出口
- 服务器节点使用私有IP地址,与负载调度器位于同一个物理网络,安全性要优于其他两种方式
4.2 TUN模式——IP隧道
- IP Tunnel,简称TUN模式
- 采用开放式的网络结构,负载调度器仅作为客户机的访问入口,各节点通过各自的Internet连接直接回应客户机,而不再经过负载调度器
- 服务器节点分散在互联网中的不同位置,具有独立的公网IP地址,通过专用IP隧道与负载调度器相互通信
注:
- 专用IP隧道进行加密————vpn,隧道加密,数据加密
- 调度器是唯一的入口
4.3 DR模式————直接路由
- Direct Routing,简称DR模式
- 采用半开放式的网络结构,与TUN模式的结构类似,但各节点并不是分散在各地,而是与调度器位于同一个物理网络
- 负载调度器与各节点服务器通过本地网络连接,不需要建立专用的IP隧道
工作模式 | 特点 |
---|---|
NAT模式——地址转换(Network Address Translation) | 类似防火墙的私有网络结构,负载调度器作为所有服务器节点的网管,即作为客户机的访问入口,负载调度器也是各节点回应客户机的访问出口,服务器节点使用私有IP地址,与负载调度器位于同一个物理网络,安全性要优于其他两种方式 |
TUN模式——IP隧道(IP Tunnel) | 采用开放式的网络结构,负载调度器仅作为客户机的访问入口,各节点通过各自的Internet连接直接回应客户机,而不再经过负载调度器,服务器节点分散在互联网中的不同位置,所有节点都具有独立的公网IP地址,通过专用IP隧道与负载调度器相互通信 |
DR模式——直接路由(Direct Routing) | 采用半开放式的网络结构,与TUN模式的结构类似,但各节点并不是分散在各地,而是与调度器位于同一个物理网络,负载调度器与各节点服务器通过本地网络连接,不需要建立专用的IP隧道 |
注:
- LVS只能基于四层的tcp/udp协议进行过滤
- nginx是7层
- 阿里云的SLB是基于四层和7层的协议进行过滤
五、关于LVS虚拟服务器
5.1 Linux Virtual Server
- 针对Linux内核的负载均衡解决方案
- 1998年5月,由我国的章文嵩博士创建
- 官方网站:http://www.linuxvirtualserver.org/
5.2 LVS的负载调度算法
5.2.1 轮询(Round Robin)
- 将收到的访问请求按照顺序轮流分配给群集中的各节点(真实服务器),均等地对待每一台服务器,而不管服务器实际的连接数和系统负载
5.2.2 加权轮询(Weighted Round Robin)
- 根据真实服务器的处理能力轮流分配收到的访问请求,调度器可以自动查询各节点的负载情况,并动态调整其权重
- 保证处理能力强的服务器承担更多的访问流量
注:
加权轮询:又叫权重,分配访问的个数
5.2.3 最少连接(Least Connections)
- 根据真实服务器已建立的连接数进行分配,将收到的访问请求优先分配给连接数最少的节点
5.2.4 加权最少连接(Weighted Least Connections)
- 在服务器节点的性能差异较大的情况下,可以为真实服务器自动调整权重
- 权重较高的节点将承担更大比例的活动连接负载