NFS存储迁移至GlusterFS

时间:2021-05-08 23:51:09

NFS存储迁移至GlusterFS

前提条件

  • 为防止脑裂,建议使用最低3台节点制作3复制集的存储卷;
  • 在进行存储迁移前,GluseterFS存储节点需先成为k8s集群中的node节点;
  • 存储切换时请勿在平台继续操作,以免数据切换后不一致;
  • GluseterFS所使用磁盘挂载在/data目录,推荐使用逻辑卷;
  • 如果之前通过修改控制器方式修改过Rainbond组件相关数据,请提前做好备份,存储切换后会重置相关修改。

部署GlusterFS

将存储节点添加至当前k8s集群,参考Rainbond官方文档安装的k8s集群扩容节点命令如下

docker exec -it kubeasz easzctl add-node NODE_IP
  • 在k8s集群所有节点安装所需要的组件

    • Ubuntu16.04/18.04
    add-apt-repository ppa:gluster/glusterfs-7
    apt-get update
    apt-get install glusterfs-client -d
    modprobe dm_thin_pool
    • CentOS 7
    yum -y install centos-release-gluster
    yum -y install glusterfs-client
    modprobe dm_thin_pool

    所有节点GlusterFS版本必须为7.*+,否则会出现无法挂载存储的情况;可通过执行glusterfs --version验证。

  • 在GluseterFS节点划分分区并挂载磁盘

    # 查看可用磁盘
    fdisk -l
    # 分区并格式化
    mkfs.xfs /dev/vdb1
    mkdir -p /data
    echo "/dev/vdb1 /data xfs defaults 1 2" >>/etc/fstab
    # 挂载
    mount -a
    # 确定/data挂载
    df -h | grep data

    以下操作在k8s集群的任一master节点执行

  • 获取对应项目

git clone https://gitee.com/liu_shuai2573/gfs-k8s.git && cd gfs-k8s
  • 设置标签使该节点只运行GFS
#设置标签,调度glusterfs的pod至指定节点
kubectl label node 10.10.10.71 10.10.10.72 10.10.10.73 storagenode=glusterfs
#设置taint策略,使该节点只运行glusterfs,如需复用glusterfs节点请忽略该操作
kubectl taint node 10.10.10.71 10.10.10.72 10.10.10.73 glusterfs=true:NoSchedule
  • 运行GFS的相关控制器(视网络及性能情况而定,大约需要两分钟)
kubectl create -f gluster-daemonset.yaml
  • 检查是否在指定节点正常运行
$ kubectl get pods -o wide --selector=glusterfs-node=daemonset
NAME READY STATUS RESTARTS AGE IP NODE NOMINATED NODE READINESS GATES
glusterfs-2k5rm 1/1 Running 0 52m 192.168.2.200 192.168.2.200 <none> <none>
glusterfs-mc6pg 1/1 Running 0 134m 192.168.2.22 192.168.2.22 <none> <none>
glusterfs-tgsn7 1/1 Running 0 134m 192.168.2.224 192.168.2.224 <none> <none>
  • 为GFS集群添加节点

    kubectl exec -ti glusterfs-2k5rm gluster peer probe 192.168.2.22
    kubectl exec -ti glusterfs-2k5rm gluster peer probe 192.168.2.224 #检测是否添加成功,成功则显示Connected状态
    kubectl exec -ti glusterfs-2k5rm gluster peer status
  • 创建服务账户并进行RBAC授权

    kubectl create -f rbac.yaml

配置k8s集群使用GFS

  • 创建provisioner资源
kubectl create -f deployment.yaml
  • 创建storageclass资源

    修改storageclass.yaml文件中的parameters.brickrootPaths字段对应的值,将GlusterFS节点的IP替换掉。

kubectl create -f storageclass.yaml
  • 创建pvc验证
kubectl create -f pvc.yaml
#创建成功时STATUS为Bound
kubectl get pvc | grep gluster-simple-claim
  • 创建pod验证

运行正常时STATUS为Running

kubectl create -f pod.yaml
kubectl get po | grep gluster-simple-pod
#验证正常后将pod删除
kubectl delete -f pod.yaml

数据备份

数据备份是考虑到实际存储切换时使用原NFS存储向GFS同步数据可能会由于受到网络因素等影响导致较慢,所以事先将NFS中的数据拷贝至手动创建的GFS存储卷中,在最终切换时再从当前的GFS卷中向切换后自动创建的卷中同步数据,需要确保GFS存储磁盘容量能够容纳以下组件的数据*2份;若实际情况NFS向GFS同步数据较快,此步骤可以忽略。

需要备份的数据如下

  • rbd-repo
  • rbd-hub
  • rbd-chaos
  • rbd-cpt-grdata

使用NFS存储的数据默认存储在NFS所运行宿主机的 /opt/rainbond/data/nfs 目录下,根据PVC名字进行划分,将上述需要备份的文件进行备份。

  • 手动创建一个存储卷,用作备份使用
$ kubectl exec -ti glusterfs-2k5rm gluster volume create backup replica 3  192.168.2.200:/data/backup 192.168.2.22:/data/backup 192.168.2.224:/data/backup
$ gluster volume start backup
#在原NFS节点挂载该卷,方便进行备份
mkdir /backup
mount.glusterfs 192.168.2.200:/backup /backup
#获取上述需备份数据与NFS存储中所对应的文件夹名称(对比VOLUME名字与NFS存储中文件夹名字)
kubectl get pvc -n rbd-system
#在原NFS节点使用rsync同步数据,可进行增量备份,使用此方式备份上述四份数据
rsync -azvP /opt/rainbond/data/nfs/组件PV名字 /backup/

切换存储

  • 删除PVC
kubectl  get pvc  -A| grep rbd-system|grep rainbondvolumerwx|awk '{print$2}'|xargs kubectl delete pvc  -n rbd-system
  • 删除PV
kubectl get pv |grep rainbondvolumerwx|awk '{print$1}'|xargs kubectl delete pv  -n rbd-system

如遇到无法删除参考文档

  • 修改rainbondvolume使用glusterfs存储

修改storageClassNameprovisioner的值。

kubectl edit rainbondvolume -n rbd-system

spec:
csiPlugin:
nfs: {}
imageRepository: registry.cn-hangzhou.aliyuncs.com/goodrain
storageClassName: glusterfs-simple
storageClassParameters:
provisioner: gluster.org/glusterfs-simple
storageRequest: 1
  • 删除控制器

如果之前通过修改控制器方式修改过Rainbond组件相关数据,pod正常创建后需再次修改,删除后会重置相关控制器参数。

删除后将会自动创建pod及对应存储pv,pvc

kubectl delete sts nfs-provisioner rbd-eventlog rbd-db rbd-etcd rbd-monitor rbd-repo -n rbd-system
kubectl delete ds rbd-chaos rbd-gateway rbd-node -n rbd-system
kubectl delete deploy rbd-api rbd-app-ui rbd-hub rbd-mq rbd-webcli rbd-worker -n rbd-system
  • 拷贝数据

查询 rbd-db,rbd-repo,rbd-hub,rbd-cpt-grdata 新创建的pv名字

kubectl get pv -n rbd-system

通过临时挂载的方式将GFS存储卷挂载出来,将之前备份的数据分别拷贝到对应目录

以 rbd-hub 为例

mkdir  /rbd-hub
mount -t glusterfs 192.168.2.187:/{rbd-hub pv名字} /rbd-hub

拷贝完毕后重启pod识别数据

kubectl get po -n rbd-system|awk '{print$1}'|xargs kubectl delete po -n rbd-system

将平台运行组件的pv及pvc删除,并登录平台将所有应用重启

kubectl get pvc -A|grep rainbondsssc|awk '{print$1,$2}'|xargs kubectl delete pvc $2 -n $1
kubectl get pv |grep rainbondsssc|awk '{print$1}'|xargs kubectl delete pv

验证

1.查看平台组件是否都处于running状态

$ kubectl get po -n  rbd-system
NAME READY STATUS RESTARTS AGE
dashboard-metrics-scraper-754cdcbbb6-lkxkb 1/1 Running 0 17m
kubernetes-dashboard-57b897f8df-wjj7s 1/1 Running 0 17m
rainbond-operator-0 2/2 Running 0 13m
rbd-api-564f456468-7gj2j 1/1 Running 1 17m
rbd-app-ui-64c7c55995-skjsg 1/1 Running 3 17m
rbd-chaos-gq4xg 1/1 Running 1 17m
rbd-db-0 2/2 Running 2 17m
rbd-etcd-0 1/1 Running 1 17m
rbd-eventlog-0 1/1 Running 1 17m
rbd-gateway-msrsd 1/1 Running 1 17m
rbd-hub-85b7b94846-b5kp6 1/1 Running 1 17m
rbd-monitor-0 1/1 Running 1 17m
rbd-mq-989c5549c-qtdqj 1/1 Running 1 17m
rbd-node-7fbqt 1/1 Running 0 17m
rbd-node-gqc5s 1/1 Running 1 17m
rbd-node-mg62k 1/1 Running 0 17m
rbd-repo-0 1/1 Running 1 17m
rbd-webcli-84969b7fc5-bhmgs 1/1 Running 1 17m
rbd-worker-78b6dc8fc4-cjtn6 1/1 Running 1 17m

2.检查使用存储的组件数据是否和迁移前一致

3.找到有使用共享存储的组件,通过grctl service get命令查看是否使用的是GlusterFS存储;通过endpoints及对应路径查看数据。

$ grctl service get gr1e52a5 -t v6j1tpha
PodVolume:
+----------------+------+----------------------------------------------------------------------------------------------------------------------------------------------------------+
| Volume | Type | Volume Mount |
+----------------+------+----------------------------------------------------------------------------------------------------------------------------------------------------------+
| /var/lib/mysql | nfs | endpoints: glusterfs-simple-rbd-cpt-grdata |
| | | path: pvc-c9e702f4-2a52-4f07-98b0-25488f9b585b/tenant/6dc4f0529b8c43d7a96db742029f43d1/service/37bf4d2a3608455d867c8289231e52a5/var/lib/mysql/gr1e52a5-0 |
| | | endpointsNamespace: rbd-system |
+----------------+------+----------------------------------------------------------------------------------------------------------------------------------------------------------+

确认完毕后删除原NFS相关资源及数据

kubectl delete pvc data-nfs-provisioner-0 -n  rbd-system
kubectl delete pv nfs-provisioner -n rbd-system