上篇说到了Redis安装、运行。今天来看一看Redis的主从复制、Sentinel;
一、主从复制
1. 配置
在Master
上修改redis.conf
// 不想用密码,所以把保护模式设置为no
protected-mode no
// 其实master上不需要配置什么,这里只是取消了保护模式
在Slave1
和Slave2
上修改redis.conf
// 同样关闭保护模式
protected-mode no
// 设置本机是谁的slave
slaveof master的ip 6379
// 当配置了slaveof后,下面这条控制本机只能读
slave-read-only yes
2. Jedis操作
// 简单设置3个连接池
private static final JedisPool masterPool;
private static final JedisPool slavePool1;
private static final JedisPool slavePool2;
static {
JedisPoolConfig jedisPoolConfig = new JedisPoolConfig();
// 最多可以有10个连接
jedisPoolConfig.setMaxTotal(10);
jedisPoolConfig.setMaxIdle(5);
jedisPoolConfig.setMinIdle(5);
masterPool = new JedisPool(jedisPoolConfig, "111.111.111.111");
slavePool1 = new JedisPool(jedisPoolConfig, "111.111.111.112");
slavePool2 = new JedisPool(jedisPoolConfig, "111.111.111.113");
}
public static void main(String[] args) throws Exception {
// 简单使用,通过try-with-resource
try (Jedis jedis = masterPool.getResource()) {
jedis.get("key1");
} catch (Exception e) {
e.printStackTrace();
}
}
3. 主从的意义
-
Redis需要读写分离吗?
可能大家会思考过这样一个问题,在MySQL中常用的读写分离,在Redis这种内存DB中是否还会需要?反对者的观点是:Redis是内存存储,读写都非常快,如果将读且分离到
Master
和Slaves
上不仅可能造成主从不同步的麻烦,甚至不见得会提升整个DB的处理能力和速度。赞成者的观点是:Redis提供的
Master
和Slave
复制功能;官网中的介绍Replication can be used both for scalability, in order to have multiple slaves for read-only queries (for example, slow O(N) operations can be offloaded to slaves), or simply for data redundancy.
甚至配置文件中的参数
slave-read-only yes
都在提示着使用者,Redis给你提供了读写分离的功能。所以,为什么不要用呢?经过思考过后,我觉得:
1 如果使用者的业务数据量不大,则完全不必做读写分离,读写均在
Master
上做即可。但是主从复制还是需要的,可将Slave
作为简单的数据转储。
2 如果使用者的业务数据量比较大,只用一个物理机Master
承担读写已不能满足业务或性能的需求,那么则可以做读且分离。即,在项目代码中封装一下对Redis的操作(如封装Jedis操作),将写操作映射给Master
,将读操作按照你自己定义的分配策略,映射给某个Slave
。
一个企业级系统最重要的指标就是“可用性”和“高性能”。
显然,上面的主从复制、读写分离能够简单的提供“高性能”,但也只是提升了“读”的性能,并不能扩展“写”。(写的扩展这里暂且不表)
另一方面,“可用性”也是极其重要的。如上结构可用性并不高,一旦Master
宕机则Redis将立即不可写,Slave
将只剩下旧数据,系统随即不可用。
必然的,Redis提供了高可用(High Availability)方案,其中之一就是Sentinel-哨兵。
二、Sentinel - 高可用
1. 什么是Sentinel?
见名知意,它是Redis提供的哨兵程序,它是分布式程序,可以这样描述它们:
哨兵一般是好几个一起站岗,他们共同监视一个
Master
以及其Slaves
。当哨兵看到Master
挂掉了,他们就会互相确认有没有看走眼,一旦多数哨兵都说它挂了,那么他们就能得出结论:Master
挂了。
此时第一个发现的Sentinel会负责进行自动故障迁移,它会立即在Slaves
中选出一个担任Master
,所有Slaves
从属于新Master
,所有客户端对Master
的操作转而到这台新Master
上。
Sentinel的主要工作如下:
监控(Monitoring): Sentinel 会不断地检查你的主服务器和从服务器是否运作正常。
提醒(Notification): 当被监控的某个 Redis 服务器出现问题时, Sentinel 可以通过 API 向管理员或者其他应用程序发送通知。
自动故障迁移(Automatic failover): 当一个主服务器不能正常工作时, Sentinel 会开始一次自动故障迁移操作, 它会将失效主服务器的其中一个从服务器升级为新的主服务器, 并让失效主服务器的其他从服务器改为复制新的主服务器; 当客户端试图连接失效的主服务器时, 集群也会向客户端返回新主服务器的地址, 使得集群可以使用新主服务器代替失效服务器。
2. 配置Sentinel
哨兵应该被放在独立的服务器上,最好最少应该有3个哨兵(3台服务器)。
-
配置文件sentinel.conf
// 26379模式是sentinel的运行端口,6379是redis-server的
port 26379
// 作为守护进程
daemonize yes
// 工作目录,设置到你统一规划的地方
dir /tmp
// log文件
dir /....
// protected-mode必须要设置的,不设置不行
protected-mode no
// 配置监视的Master,注意无需配置其Slave,Sentinel会自己去询问Master
// sentinel monitor master-name ip redis-port quorum
// quorum 哨兵们认为master客观死亡(Objectively Down)所需要的法定人。无论是否设置这个值,想要启动failover都必须有多数哨兵同意
sentinel monitor yewu01 127.0.0.1 6379 2
// 如果30000 ms后master还是不回应,就说明Master处于主观死亡(Subjectively Down)
sentinel down-after-milliseconds yewu01 30000
// 当发生failover的同时,1个slave开始与新master进行同步。意思是:此slave开始接收master的RDB文件而不能对外提供服务了,而其它slave还能对外服务(具体能否对外服务看第二个//),所以越少意味着redis能越快恢复对外服务
// 同时还要搭配配置slave的redis.conf中的 slave-serve-stale-data参数,指定是否可用过期数据
sentinel parallel-syncs yewu01 1
// 执行failover多久算failover超时
sentinel failover-timeout yewu01 180000 -
运行sentinel
虽然 Redis Sentinel 释出为一个单独的可执行文件redis-sentinel
, 但实际上它只是一个运行在特殊模式下的 Redis 服务器, 你可以在启动一个普通 Redis 服务器时通过给定--sentinel
选项来启动 Redis Sentinel 。// 1. 用redis-server加参数 --sentinel的方式启动
redis-server /path/to/sentinel.conf --sentinel
// 2. 用redis-sentinel 方式启动
redis-sentinel /path/to/sentinel.conf
//注意!注意!注意!不要忘记在防火墙添加端口,我的是CentOS7,所以如下
firewall-cmd --zone=public --add-port=26379/tcp --permanent -
查看状态
用redis-cli -h <hostname> -p 26379
登录到Sentinel;Sentinel 可接受的命令(官网页面搜索Sentinel API):
-
PING
:返回 PONG 。 -
SENTINEL masters
:列出所有被监视的主服务器,以及这些主服务器的当前状态。 -
SENTINEL master <master name>
:特定主服务器的当前状态。 -
SENTINEL slaves <master name>
:列出给定主服务器的所有从服务器,以及这些从服务器的当前状态。 -
SENTINEL sentinels <master name>
Show a list of sentinel instances for this master, and their state. -
SENTINEL get-master-addr-by-name <master name>
: 返回给定名字的主服务器的 IP 地址和端口号。 如果这个主服务器正在执行故障转移操作, 或者针对这个主服务器的故障转移操作已经完成, 那么这个命令返回新的主服务器的 IP 地址和端口号。 -
SENTINEL reset <pattern>
: 重置所有名字和给定模式 pattern 相匹配的主服务器。 pattern 参数是一个 Glob 风格的模式。 重置操作清楚主服务器目前的所有状态, 包括正在执行中的故障转移, 并移除目前已经发现和关联的, 主服务器的所有从服务器和 Sentinel 。 -
SENTINEL failover
: 当主服务器失效时, 在不询问其他 Sentinel 意见的情况下, 强制开始一次自动故障迁移 (不过发起故障转移的 Sentinel 会向其他 Sentinel 发送一个新的配置,其他 Sentinel 会根据这个配置进行相应的更新)。
-
-
sentinel.conf
配置被改变每当一个Sentinel启动后,它就会修改并通知其它Sentinel同时修改自身的
sentinel.conf
文件,例如:生成一个myid
sentinel myid 0f9bd55b18aa54a5f5efc6fb7b3371da56d48d4a
文件最后会加上如下:
# Generated by CONFIG REWRITE
sentinel known-sentinel yewu01 192.168.0.1 26379 58a141a0f97669925bcc84e3a3b3dbc8602dea99
sentinel known-sentinel yewu01 192.168.0.2 26379 a0fbf10df21374f8b5cac1f410d9df3b26618575
sentinel current-epoch 0
3. failover - 故障转移
-
执行
pkill redis-sever
关掉Master
观察Sentinel日志如下:这是一个被选为
failover
执行者的sentinel的日志,英文挺清晰明了的就不翻译了:6480:X 14 Feb 19:46:54.746 # +sdown master yewu01 10.173.244.98 6379
6480:X 14 Feb 19:46:54.798 # +odown master yewu01 10.173.244.98 6379 #quorum 3/2
6480:X 14 Feb 19:46:54.798 # +new-epoch 1
6480:X 14 Feb 19:46:54.798 # +try-failover master yewu01 10.173.244.98 6379
6480:X 14 Feb 19:46:54.807 # +vote-for-leader 214bd3df8363327488cd8c430166cf48cd2ab33a 1
6480:X 14 Feb 19:46:54.819 # f7462491e6881da2c1efbfd6465ece6380c653cf voted for 214bd3df8363327488cd8c430166cf48cd2ab33a 1
6480:X 14 Feb 19:46:54.823 # 6c95942bbcc39a0703ec5d54a76d6a696a500a17 voted for 214bd3df8363327488cd8c430166cf48cd2ab33a 1
6480:X 14 Feb 19:46:54.907 # +elected-leader master yewu01 10.173.244.98 6379
6480:X 14 Feb 19:46:54.907 # +failover-state-select-slave master yewu01 10.173.244.98 6379
6480:X 14 Feb 19:46:54.974 # +selected-slave slave 10.174.249.145:6379 10.174.249.145 6379 @ yewu01 10.173.244.98 6379
6480:X 14 Feb 19:46:54.974 * +failover-state-send-slaveof-noone slave 10.174.249.145:6379 10.174.249.145 6379 @ yewu01 10.173.244.98 6379
6480:X 14 Feb 19:46:55.057 * +failover-state-wait-promotion slave 10.174.249.145:6379 10.174.249.145 6379 @ yewu01 10.173.244.98 6379
6480:X 14 Feb 19:46:55.534 # +promoted-slave slave 10.174.249.145:6379 10.174.249.145 6379 @ yewu01 10.173.244.98 6379
6480:X 14 Feb 19:46:55.534 # +failover-state-reconf-slaves master yewu01 10.173.244.98 6379
6480:X 14 Feb 19:46:55.581 * +slave-reconf-sent slave 10.251.22.210:6379 10.251.22.210 6379 @ yewu01 10.173.244.98 6379
6480:X 14 Feb 19:46:55.957 # -odown master yewu01 10.173.244.98 6379
6480:X 14 Feb 19:46:56.041 * +slave-reconf-inprog slave 10.251.22.210:6379 10.251.22.210 6379 @ yewu01 10.173.244.98 6379
6480:X 14 Feb 19:46:56.042 * +slave-reconf-done slave 10.251.22.210:6379 10.251.22.210 6379 @ yewu01 10.173.244.98 6379
6480:X 14 Feb 19:46:56.096 # +failover-end master yewu01 10.173.244.98 6379
6480:X 14 Feb 19:46:56.096 # +switch-master yewu01 10.173.244.98 6379 10.174.249.145 6379
6480:X 14 Feb 19:46:56.097 * +slave slave 10.251.22.210:6379 10.251.22.210 6379 @ yewu01 10.174.249.145 6379
6480:X 14 Feb 19:46:56.097 * +slave slave 10.173.244.98:6379 10.173.244.98 6379 @ yewu01 10.174.249.145 6379
6480:X 14 Feb 19:47:26.148 # +sdown slave 10.173.244.98:6379 10.173.244.98 6379 @ yewu01 10.174.249.145 6379这是非
failover
执行者的Sentinel的日志:30052:X 14 Feb 19:46:54.725 # +sdown master yewu01 10.173.244.98 6379
30052:X 14 Feb 19:46:54.816 # +new-epoch 1
30052:X 14 Feb 19:46:54.823 # +vote-for-leader 214bd3df8363327488cd8c430166cf48cd2ab33a 1
30052:X 14 Feb 19:46:55.584 # +config-update-from sentinel 214bd3df8363327488cd8c430166cf48cd2ab33a 10.251.22.210 26379 @ yewu01 10.173.244.98 6379
30052:X 14 Feb 19:46:55.584 # +switch-master yewu01 10.173.244.98 6379 10.174.249.145 6379
30052:X 14 Feb 19:46:55.584 * +slave slave 10.251.22.210:6379 10.251.22.210 6379 @ yewu01 10.174.249.145 6379
30052:X 14 Feb 19:46:55.584 * +slave slave 10.173.244.98:6379 10.173.244.98 6379 @ yewu01 10.174.249.145 6379
30052:X 14 Feb 19:47:25.602 # +sdown slave 10.173.244.98:6379 10.173.244.98 6379 @ yewu01 10.174.249.145 6379日志显示,其中一个
Slave
被提升为了Master
。 -
failover
后配置被变更Sentinel首先通过命令的方式来做
redis-server
和sentinel
的配变更。之后会将配置持久化到redis.conf
和sentinel.conf
文件中。redis.conf
中
被选为Master
的,其slaveof
键值被直接删除;
仍然还是Slave
的,其slaveof
值被指定为新Master
的地址;-
所有Sentinel的
sentinel.conf
中sentinel monitor
被指定为新Master
的地址;// epoch “时期”(版本的意思)被自增1
sentinel current-epoch 1
4. Jedis操作
显然,经过故障转移后,主从结构已经发生了改变且主已经死亡,如果还按照之前那样写死IP的方式连接Redis的话,势必会出现错误。可以想到,在Sentinel结构下,你必须向哨兵询问来获取谁是Master
。
private static final JedisSentinelPool pool;
static {
JedisPoolConfig jedisPoolConfig = new JedisPoolConfig();
jedisPoolConfig.setMaxTotal(10);
jedisPoolConfig.setMaxIdle(5);
jedisPoolConfig.setMinIdle(5);
Set<String> sentinels = new HashSet<>(Arrays.asList(
"111.111.111.111:26379",
"111.111.111.112:26379",
"111.111.111.113:26379"
));
GenericObjectPoolConfig poolConfig = new GenericObjectPoolConfig();
poolConfig.setMaxTotal(10);
poolConfig.setMaxIdle(5);
poolConfig.setMinIdle(5);
pool = new JedisSentinelPool("yewu01", sentinels, jedisPoolConfig);
}
public static void main(String[] args) throws Exception {
String key1 = "key1";
try (Jedis jedis = pool.getResource()) {
jedis.set(key1, "222");
System.out.println(jedis.get(key1));
} catch (Exception e) {
e.printStackTrace();
}
}
以上。
参考文献:
[ 1 ] https://redis.io/topics/sentinel
[ 2 ] http://www.redis.cn/topics/sentinel.html