使用codis-admin搭建codis集群

时间:2023-07-16 08:34:56

目的

Redis Codis 部署安装的文章中,介绍了通过fe在web上搭建codis的基本步骤和方法,也介绍了codis-admin的相关说明,为了更好的熟悉codis-admin的使用,本文将使用codis-admin直接搭建codis集群(和fe进行相关的对比)。这样做的另一个目的是为实现自动化脚本部署的时候做相关的准备。

环境

Redis Codis 部署安装中的环境一样,包括各个服务的IP和端口,以及安装方法。

机器

服务

端口

端口说明

依赖

192.168.163.131/132/133(Ubuntu 16.04)

Codis

7021/7022

server端口:主/从(三台)

GO

11080

proxy管理端口(三台)

18080

dashboard管理端口(一台)

10890

fe管理端口(一台)

10086

sentinel(三台)

192.168.163.131/132/133(Ubuntu 16.04)

zookeeper

2181

zk客户端监听端口(三台)

JDK

2888

zk内部通讯端口(三台)

3888

zk选举端口(三台)

开始

首先要保证ZooKeeper、Dashboard、Proxy、Server、Sentine、fe等都已经开启。根据Redis Codis 部署安装文章的安装和配置,进行codis相关组件的开启、关闭(ZK通过上篇文文章说明):

开启关闭进程

1)codis-server

开启(三台)

codis-server /etc/codis/codis-server/redis7021.conf
codis-server /etc/codis/codis-server/redis7022.conf

关闭(三台)

进入到redis里面进行shutdown或则kill。

2)dashboard

开启(一台)

codis-dashboard --ncpu= --config=/etc/codis/codis-dashboard/dashboard.toml --log=/usr/local/codis/logs/dashboard.log --log-level=warn &

关闭(一台)

codis-admin --dashboard=192.168.163.131: --shutdown

3)codis-fe

开启(一台)

cd /etc/codis/codis-fe/

codis-admin --dashboard-list --zookeeper=192.168.163.131: | tee codis.json

codis-fe --ncpu= --dashboard-list=/etc/codis/codis-fe/codis.json --listen=192.168.163.131: --log=/usr/local/codis/logs/fe.log --log-level=warn --assets-dir=/usr/local/codis/bin/assets/ &

关闭(一台)

ps -ef|grep codis-fe|grep -v grep|awk '{print $2}'|xargs kill

4)Proxy

开启(三台)

codis-proxy --ncpu= --config=/etc/codis/codis-proxy/proxy.toml --log=/usr/local/codis/logs/proxy.log --log-level=warn &

关闭(三台)

codis-admin --proxy=192.168.163.131: --shutdown
codis-admin --proxy=192.168.163.132: --shutdown
codis-admin --proxy=192.168.163.133: --shutdown

codis-admin应用

1)Proxy

① 添加Proxy到Dashboard,并且设置成Online(3个)。

Proxy进程起来之后一直处于proxy waiting online ...状态,不会接受请求(该状态不会注册到zk的codis3和jodis里)。先加入到Dashboard、注册到zk(jodis、codis3)并设置成online:

codis-admin --dashboard=192.168.163.131: --create-proxy --addr=192.168.163.131:
codis-admin --dashboard=192.168.163.132: --create-proxy --addr=192.168.163.131:
codis-admin --dashboard=192.168.163.133: --create-proxy --addr=192.168.163.131:

等于codis-fe的操作:

使用codis-admin搭建codis集群

执行完毕之后,api会调用:

[WARN] [0xc4202bf440] API call /api/topom/proxy/create/4c0ca749efb5aad2b20b8d84b1bb6905/192.168.163.133: from 192.168.163.131: [192.168.163.1]
[WARN] create proxy-[cfa02d4002da74e6b1f3b51f1416aa1d]

可以在日志里看到 proxy is working ...

②:从Dashboard上删除掉Proxy。

codis-admin --dashboard=192.168.163.131: --remove-proxy --addr=192.168.163.133:

等于codis-fe的操作:

使用codis-admin搭建codis集群

执行完毕之后,api会调用:

[WARN] [0xc4202bf440] API call /api/topom/proxy/remove/4c0ca749efb5aad2b20b8d84b1bb6905/cfa02d4002da74e6b1f3b51f1416aa1d/ from 192.168.163.132: []
[WARN] remove proxy-[cfa02d4002da74e6b1f3b51f1416aa1d]

需要注意的是,执行该操作之后,不仅从DashBoard退出,而且也会把进程退出掉,后续要开启才能加入。

③:重新同步所有的slots,当Proxy的slots出现异常的时候执行。

codis-admin --dashboard=192.168.163.131: --reinit-proxy --addr=192.168.163.131:

等于codis-fe的操作:

使用codis-admin搭建codis集群

执行完毕之后,api会调用:

[WARN] [0xc4202bf440] API call /api/topom/proxy/reinit/4c0ca749efb5aad2b20b8d84b1bb6905/4f07158ae347d67b1af825fd8e84b2f9 from 192.168.163.131: [192.168.163.1]
[WARN] proxy-[4f07158ae347d67b1af825fd8e84b2f9] reinit:

2)Group

① 添加Group到Dashboard(3个)

codis-admin --dashboard=192.168.163.131: --create-group --gid=
codis-admin --dashboard=192.168.163.131: --create-group --gid=
codis-admin --dashboard=192.168.163.131: --create-group --gid=

等于codis-fe的操作:

使用codis-admin搭建codis集群

执行完毕之后,api会调用:

[WARN] [0xc4202bf440] API call /api/topom/group/create/4c0ca749efb5aad2b20b8d84b1bb6905/ from 192.168.163.132: []
[WARN] create group-[]:
{
"id": ,
"servers": [],
"promoting": {},
"out_of_sync": false
}
...

② 删除Group

codis-admin --dashboard=192.168.163.131: --remove-group --gid=

等于codis-fe的操作:

使用codis-admin搭建codis集群

执行完毕之后,api会调用:

[WARN] [0xc4202bf440] API call /api/topom/group/remove/4c0ca749efb5aad2b20b8d84b1bb6905/ from 192.168.163.132: []
[WARN] remove group-[]:
{
"id": ,
"servers": [],
"promoting": {},
"out_of_sync": false
}

③ 添加Server到Group

#group1
codis-admin --dashboard=192.168.163.131: --group-add --gid= --addr=192.168.163.131:
codis-admin --dashboard=192.168.163.131: --group-add --gid= --addr=192.168.163.132: #group2
...
#group3
...

等于codis-fe的操作:

使用codis-admin搭建codis集群

执行完之后,api会调用:

[WARN] [0xc4202bf440] API call /api/topom/group/add/4c0ca749efb5aad2b20b8d84b1bb6905//192.168.163.132: from 192.168.163.132: []
[WARN] update group-[]:
{
"id": ,
"servers": [
{
"server": "192.168.163.131:7021",
"datacenter": "",
"action": {},
"replica_group": false
},
{
"server": "192.168.163.132:7022",
"datacenter": "",
"action": {},
"replica_group": false
}
],
"promoting": {},
"out_of_sync": false
}
...

③ 移除Group中的Server

codis-admin --dashboard=192.168.163.131: --group-del --gid= --addr=192.168.163.132:

等于codis-fe的操作:

使用codis-admin搭建codis集群

执行时,调用的api:

[WARN] [0xc4202bf440] API call /api/topom/group/del/4c0ca749efb5aad2b20b8d84b1bb6905//192.168.163.132: from 192.168.163.132: []
[WARN] update group-[]:
{
"id": ,
"servers": [
{
"server": "192.168.163.131:7021",
"datacenter": "",
"action": {},
"replica_group": false
}
],
"promoting": {},
"out_of_sync": false
}

④ 给Group添加Server

需要注意,做高可用的话每个Group里需要至少2个Server,一主一从。默认第2个Server是从。

codis-admin --dashboard=192.168.163.131: --sync-action --create --addr=192.168.163.132:7022 --第2个server

等于codis-fe的操作:

使用codis-admin搭建codis集群

执行时,调用的api:

[WARN] [0xc4202bf440] API call /api/topom/group/action/create/4c0ca749efb5aad2b20b8d84b1bb6905/192.168.163.132: from 192.168.163.132: []
[WARN] update group-[]
...
[WARN] server-[192.168.163.132:] action prepare
[WARN] update group-[]
...
[WARN] sync-[192.168.163.132:] process action
[WARN] server-[192.168.163.132:] action failed = false
[WARN] update group-[]:
{
"id": ,
"servers": [
{
"server": "192.168.163.131:7021",
"datacenter": "",
"action": {},
"replica_group": false
},
{
"server": "192.168.163.132:7022",
"datacenter": "",
"action": {
"state": "synced"
},
"replica_group": false
}
],
"promoting": {},
"out_of_sync": false
}

⑤ 提升Group的一个Slave为Master

codis-admin --dashboard=192.168.163.131: --promote-server --gid= --addr=192.168.163.133:

等于codis-fe的操作:

使用codis-admin搭建codis集群

执行时,调用的api:

[WARN] [0xc4202bf440] API call /api/topom/group/promote/4c0ca749efb5aad2b20b8d84b1bb6905//192.168.163.133: from 192.168.163.132: []
[WARN] group-[] will promote index =
[WARN] update group-[]
"state": "preparing"
...
[WARN] group-[] resync to prepared
[WARN] update group-[]:
"state": "prepared"
...
[WARN] update group-[]:
"state": "finished"
...
[WARN] group-[] resync to finished
[WARN] update group-[]:
{
"id": ,
"servers": [
{
"server": "192.168.163.133:7021",
"datacenter": "",
"action": {},
"replica_group": false
},
{
"server": "192.168.163.131:7022",
"datacenter": "",
"action": {},
"replica_group": false
}
],
"promoting": {},
"out_of_sync": false
}

这里还要注意,Slave提升成Master之后,老Master还需要执行slaveof才能进行新的复制。

codis-admin --dashboard=192.168.163.131: --sync-action --create --addr=192.168.163.131:

3)Slots

注意:此时,所有的slots都处在offline状态,需要进行分配slots。否则客户端会报错:

ERR handle request, slot is not ready, may be offline

① 分配slots,离开offline状态。迁移某一段范围的slots到指定的group,分配所有的slots到Group中。

codis-admin --dashboard=192.168.163.131: --slot-action --create-range --beg= --end= --gid=

codis-admin --dashboard=192.168.163.131: --slot-action --create-range --beg= --end= --gid=

codis-admin --dashboard=192.168.163.131: --slot-action --create-range --beg= --end= --gid=

等于codis-fe的操作:

使用codis-admin搭建codis集群

执行时,调用的api:

[WARN] [0xc4202bf440] API call /api/topom/slots/action/create-range/4c0ca749efb5aad2b20b8d84b1bb6905/// from 192.168.163.131: [192.168.163.1]
[WARN] update slot-[]:
"state": "pending",
...
[WARN] slot-[] action prepare:
"state": "pending",
[WARN] update slot-[]:
"state": "preparing",
...
[WARN] slot-[] resync to prepared
"state": "prepared",
...
[WARN] slot-[] resync to migrating
"state": "migrating",
...
[WARN] slot-[] process action
[WARN] slot-[] action complete
"state": "migrating",
...
[WARN] slot-[] resync to finished
"state": "finished",
...

注意:正在迁移的slots中的key被访问,该key会被立马迁移到新的group,才能被访问。迁移好之后的slots通过--slots-status查看,发生了变化:

{
"id": ,
"backend_addr": "192.168.163.131:7021", --迁移后新增
"backend_addr_group_id": , --迁移后新增
"forward_method":
},

② 迁移slots,迁移指定数量的slots从一个Group到另一个Group。

从Group2中迁移100个slots到Group3中:

codis-admin --dashboard=192.168.163.131: --slot-action --create-some --gid-from= --gid-to= --num-slots=

等于codis-fe的操作:

使用codis-admin搭建codis集群

执行时,调用的api:

[WARN] [0xc4202bf440] API call /api/topom/slots/action/create-some/4c0ca749efb5aad2b20b8d84b1bb6905/// from 192.168.163.132: []
"state": "pending",
...
[WARN] slot-[] action prepare:
"state": "pending",
...
"state": "preparing",
[WARN] slot-[] resync to prepared
"state": "prepared",
[WARN] slot-[] resync to migrating
"state": "migrating",
[WARN] slot-[] resync to finished
"state": "finished",
... 

注意,勾选Action Status可以查看迁移的进度。

③ 停止、开启Slots迁移。

停止:

 codis-admin --dashboard=192.168.163.131: --slot-action --disabled=

等于codis-fe的操作:

使用codis-admin搭建codis集群

执行时,调用的api:

[WARN] [0xc4202bf440] API call /api/topom/slots/action/disabled/4c0ca749efb5aad2b20b8d84b1bb6905/ from 192.168.163.132: []
[WARN] set action disabled = true

开启:

codis-admin --dashboard=192.168.163.131: --slot-action --disabled=

等于codis-fe的操作:

使用codis-admin搭建codis集群

执行时,调用的api:

[WARN] [0xc4202bf440] API call /api/topom/slots/action/disabled/4c0ca749efb5aad2b20b8d84b1bb6905/ from 192.168.163.132: []
[WARN] set action disabled = false

④ 平均分配slots,各个Group平均分配1024个slots。

codis-admin --dashboard=192.168.163.131: --rebalance --confirm

--confirm 表示执行rebalance,不加表示查看(不执行)

等于codis-fe的操作:

使用codis-admin搭建codis集群

执行时,调用的api:

[WARN] [0xc4202bf440] API call /api/topom/slots/rebalance/4c0ca749efb5aad2b20b8d84b1bb6905/ from 192.168.163.132: []
...
[WARN] slot-[] resync to finished
...

⑤ slots迁移的时间间隔

codis-admin --dashboard=192.168.163.131: --slot-action  --interval=

等于codis-fe的操作:

使用codis-admin搭建codis集群

执行时,调用的api:

[WARN] [0xc4202bf440] API call /api/topom/slots/action/interval/4c0ca749efb5aad2b20b8d84b1bb6905/ from 192.168.163.132: []
[WARN] set action interval =

4)Sentinel 高可用

① 添加Sentinel(3个)

codis-admin --dashboard=192.168.163.131: --sentinel-add --addr=192.168.163.131:
codis-admin --dashboard=192.168.163.131: --sentinel-add --addr=192.168.163.132:
codis-admin --dashboard=192.168.163.131: --sentinel-add --addr=192.168.163.133:

等于codis-fe的操作:

使用codis-admin搭建codis集群

执行时,调用的api:

[WARN] [0xc4202bf440] API call /api/topom/sentinels/add/4c0ca749efb5aad2b20b8d84b1bb6905/192.168.163.131: from 192.168.163.132: []
[WARN] update sentinel:
{
"servers": [
"192.168.163.131:10086"
],
"out_of_sync": true
}
...

为了保证Sentinel服务的正常,需要再resync下sentinel:

codis-admin --dashboard=192.168.163.131: --sentinel-resync

等于codis-fe的操作:

使用codis-admin搭建codis集群

执行时,调用的api:

[WARN] [0xc4202bf440] API call /api/topom/sentinels/resync-all/4c0ca749efb5aad2b20b8d84b1bb6905 from 192.168.163.132: []
[WARN] rewatch sentinels = [192.168.163.131: 192.168.163.132: 192.168.163.133:]

② 移除Sentinel

codis-admin --dashboard=192.168.163.131: --sentinel-del --addr=192.168.163.133:

等于codis-fe的操作:

使用codis-admin搭建codis集群

执行时,调用的api:

[WARN] [0xc4202bf440] API call /api/topom/sentinels/del/4c0ca749efb5aad2b20b8d84b1bb6905/192.168.163.133:/ from 192.168.163.132: []

到此,通过codis-admin已经完成了Codis的搭建。

总结

通过本文的说明,进一步理顺了codis-admin的各个命令。可以不依赖fe的web界面进行Codis集群的搭建,可以为自动化的一些脚本做好更好的支持工作。