这一篇,主要介绍下 Nginx + KeepAlived 如何配置 HA(高可用性”(High Availability)通常来描述一个系统经过专门的设计,从而减少停工时间,而保持其服务的高度可用性)。
在项目部署过程中,代理服务器 Nginx 要做到线上高可用,避免出现单点故障,因此需要至少 2 台服务器才行。所以计划使用 2 台 nginx 代理服务器,通过 Keepalived 来实现 nginx 的 HA,实现一台 nginx 代理服务器宕机,另一台备机自动接管服务的效果。在这里 nginx 做反向代理,实现后端应用服务器(如 Tomcat 等)的负载均衡。
1 KeepAlived介绍
Keepalived 是一个基于 VRRP 协议来实现的服务高可用方案,可以利用其来避免 IP 单点故障,类似的工具还有 heartbeat、corosync、pacemaker。但是它一般不会单独出现,而是与其它负载均衡技术(如lvs、haproxy、nginx)一起工作来达到集群的高可用。
2. 安装软件
2.1 测试环境
代理机器 2 台:CentOS release 6.9 (Final) 2.6.32-696.el6.x86_64
机器 IP:192.168.220.58(web58,做BACKUP)、192.168.220.59(web59,做MASTER)
虚拟 IP:192.168.220.60
2.2 安装 Nginx
在 2 台机器上,安装 Nginx。
安装命令:yum install -y nginx
查看安装的 Nginx 版本:nginx -v
版本信息如下:
nginx version: nginx/1.10.2
另:一些软件常规配置命令:
chkconfig nginx --list
chkconfig nginx on
service nginx status
service nginx start
2.3 测试 Nginx
在浏览器中,直接输入地址 http://192.168.220.58 和 192.168.220.59,如果打开主页面正常,说明 Nginx 安装并启动成功。
2.4 安装 Keepalived
在 2 台机器上,安装 Keepalived。
安装命令:yum install -y keepalived
查看安装的 Keepalived 版本:keepalived -v
版本信息如下:
Keepalived v1.2.13 (03/19,2015)
另:一些软件常规配置命令:
chkconfig keepalived --list
chkconfig keepalived on
service keepalived status
service keepalived start
3 Keepalived 实现 nginx 高可用
3.1 nginx 监控脚本
该脚本检测 ngnix 的运行状态,并在 nginx 进程不存在时尝试重新启动 ngnix,如果启动失败则停止 keepalived,准备让其它机器接管。
路径:/etc/keepalived/check_nginx.sh:
#! /bin/bash
counter=$(ps -C nginx --no-heading|wc -l)
if [ "${counter}" = "0" ]; then
/etc/rc.d/init.d/nginx start
sleep 2
counter=$(ps -C nginx --no-heading|wc -l)
if [ "${counter}" = "0" ]; then
/etc/rc.d/init.d/keepalived stop
fi
fi
3.2 keepalived.conf 配置
! Configuration File for keepalived
global_defs {
notification_email {
acassen@firewall.loc
failover@firewall.loc
sysadmin@firewall.loc
}
notification_email_from Alexandre.Cassen@firewall.loc
smtp_server 192.168.200.1
smtp_connect_timeout 30
router_id LVS_DEVEL
}
vrrp_script chk_nginx {
# script "killall -0 nginx"
script "/etc/keepalived/check_nginx.sh"
interval 2
weight -5
fall 3
rise 2
}
vrrp_instance VI_1 {
state MASTER
interface eth0
mcast_src_ip 192.168.220.59
virtual_router_id 51
priority 101
advert_int 2
authentication {
auth_type PASS
auth_pass 1111
}
virtual_ipaddress {
192.168.220.60
}
track_script {
chk_nginx
}
}
在另外一台代理服务器上,只需要改变 state MASTER -> state BACKUP,priority 101 -> priority 100,mcast_src_ip 192.168.220.59 -> mcast_src_ip 192.168.220.58 即可。
4 测试
4.1 查看网络
在两台机器上输入命令 ip a |grep eth0,则看到如下结果:
[root@web59 html]# ip a |grep eth0
2: eth0: <BROADCAST,MULTICAST,UP,LOWER_UP> mtu 1500 qdisc pfifo_fast state UP qlen 1000
inet 192.168.220.59/24 brd 192.168.220.255 scope global eth0
inet 192.168.220.60/32 scope global eth0
[root@web58 html]# ip a |grep eth0
2: eth0: <BROADCAST,MULTICAST,UP,LOWER_UP> mtu 1500 qdisc pfifo_fast state UP qlen 1000
inet 192.168.220.58/24 brd 192.168.220.255 scope global eth0
浏览器访问 192.168.220.60,正常且走的是 59 机器上的 nginx。
4.2 停掉 Keepalived MASTER
停掉 59 机器上的 Keepalived 服务,就相当于机器直接挂掉的情况,可以看到 58 会自动接管 MASTER,这是访问 192.168.220.60,正常且走的是 58 机器上的 nginx。
再次启动 59 机器的 Keepalived,可以看到虚拟 IP 又漂移到了 59 机器上。
4.3 停掉 MASTER 机器上的 Nginx
如果停掉 59 机器上的 Nginx,相当于只是代理服务器挂掉了,可以看到 Keepalived 会自动执行自定义的检查脚本,会尝试重启 Nginx 服务,如果启动成功,则虚拟 IP 不会漂移;如果尝试启动失败,则虚拟 IP 将漂移到 58 机器上。