Ceph RBD CephFS 存储

时间:2021-01-28 10:54:26

Ceph RBD  CephFS 存储

环境准备: (这里只做基础测试, ceph-manager , ceph-mon, ceph-osd 一共三台)

10.6.0.140 = ceph-manager

10.6.0.187 = ceph-mon-1

10.6.0.188 = ceph-osd-1

10.6.0.94 = node-94

注: ceph 对时间要求很严格, 一定要同步所有的服务器时间

一、在 manager 上面修改 /etc/hosts :

10.6.0.187 ceph-mon-1
10.6.0.188 ceph-osd-1
10.6.0.94 node-94

二、并修改各服务器上面的 hostname (说明:ceph-deploy工具都是通过主机名与其他节点通信)

hostnamectl --static set-hostname ceph-manager
hostnamectl --static set-hostname ceph-mon-1
hostnamectl --static set-hostname ceph-osd-1
hostnamectl --static set-hostname node-94

三、配置manager节点与其他节点ssh key 访问

[root@ceph-manager ~]# ssh-keygen

将key 发送到各节点中

[root@ceph-manager ~]#ssh-copy-id ceph-mon-1
[root@ceph-manager ~]#ssh-copy-id ceph-osd-1

四、在manager节点安装 ceph-deploy

[root@ceph-manager ~]#yum -y install centos-release-ceph
[root@ceph-manager ~]#yum makecache
[root@ceph-manager ~]#yum -y install ceph-deploy ntpdate

在其他各节点安装 ceph 的yum源

[root@ceph-mon-1 ~]# yum -y install centos-release-ceph
[root@ceph-mon-1 ~]# yum makecache

[root@ceph-osd-1 ~]# yum -y install centos-release-ceph
[root@ceph-osd-1 ~]# yum makecache

五、配置ceph集群

创建ceph 目录
[root@ceph-manager ~]#mkdir -p /etc/ceph
[root@ceph-manager ~]#cd /etc/ceph

创建监控节点:
[root@ceph-manager /etc/ceph]#ceph-deploy new ceph-mon-1

执行完毕会生成 ceph.conf ceph.log ceph.mon.keyring 三个文件

编辑 ceph.conf 增加 osd 节点数量
在最后增加:
osd pool default size = 1

使用ceph-deploy在所有机器安装ceph

[root@ceph-manager /etc/ceph]# ceph-deploy install ceph-manager ceph-mon-1 ceph-osd-1

如果出现错误,也可以到各节点中直接 yum -y install ceph ceph-radosgw 进行安装

初始化监控节点

[root@ceph-manager /etc/ceph]# ceph-deploy mon create-initial

osd 节点创建存储空间

[root@ceph-osd-1 ~]# mkdir -p /opt/osd1

在管理节点上启动 并 激活 osd 进程

[root@ceph-manager ~]# ceph-deploy osd prepare ceph-osd-1:/opt/osd1
[root@ceph-manager ~]# ceph-deploy osd activate ceph-osd-1:/opt/osd1

把管理节点的配置文件与keyring同步至其它节点

[root@ceph-manager ~]# ceph-deploy admin ceph-mon-1 ceph-osd-1

查看集群健康状态 (HEALTH_OK 表示OK)

[root@ceph-manager ~]# ceph health
HEALTH_OK

客户端 挂载: ceph 有多种挂载方式, rbd 块设备映射, cephfs 挂载 等

注:
在生产环境中,客户端应该对应pool的权限,而不是admin 权限

[root@ceph-manager ~]# ssh-copy-id node-94

客户端安装ceph
[root@ceph-manager ~]# ceph-deploy install node-94

或者 登陆 node-94 执行 yum -y install ceph ceph-radosgw

如果ssh 非22端口,会报错 可使用 scp 传

scp -P端口 ceph.conf node-94:/etc/ceph/
scp -P端口 ceph.client.admin.keyring node-94:/etc/ceph/

创建一个pool
[root@ceph-manager ~]# ceph osd pool create press 100
pool 'press' created

设置pool 的pgp_num
[root@ceph-manager ~]# ceph osd pool set press pgp_num 100

查看创建的pool
[root@ceph-manager ~]# ceph osd lspools
0 rbd,1 press,

设置副本数为2 (osd 必须要大于或者等于副本数,否则报错, 千万注意)
[root@ceph-manager ~]# ceph osd pool set press size 2

创建一个100G 名为 image 镜像
[root@ceph-manager ~]# rbd create -p press --size 100000 image

查看一下镜像:
[root@ceph-manager ~]# rbd -p press info image
rbd image 'image':
size 100000 MB in 25000 objects
order 22 (4096 kB objects)
block_name_prefix: rb.0.104b.74b0dc51
format: 1

客户端块存储挂载:
在node-94 上面 map 镜像
[root@node-94 ~]# rbd -p press map image
/dev/rbd0

格式化 image
[root@node-94 ~]# mkfs.xfs /dev/rbd0

创建挂载目录
[root@node-94 ~]# mkdir /opt/rbd

挂载 rbd
[root@node-94 ~]# mount /dev/rbd0 /opt/rbd

[root@node-94 ~]# time dd if=/dev/zero of=haha bs=1M count=1000

取消 map 镜像
[root@node-94 ~]# umount /opt/rbd
[root@node-94 ~]# rbd unmap /dev/rbd0

客户端 cephFS 文件系统 (cephFS 必须要有2个osd 才能运行,请注意):

使用 cephFS 集群中必须有 mds 服务

创建 mds 服务 (由于机器有限就在 mon 的服务器上面 创建 mds 服务)
[root@ceph-manager ~]# ceph-deploy mds create ceph-mon-1

创建2个pool 做为文件系统的data 与 metadata

[root@ceph-manager ~]# ceph osd pool create cephfs_data 99
pool 'cephfs_data' created

[root@ceph-manager ~]# ceph osd pool create cephfs_metadata 99
pool 'cephfs_metadata' created

创建 文件系统:
[root@ceph-manager ~]# ceph fs new jicki cephfs_metadata cephfs_data
new fs with metadata pool 6 and data pool 5

查看所有文件系统:
[root@ceph-manager ~]# ceph fs ls
name: jicki, metadata pool: cephfs_metadata, data pools: [cephfs_data ]

删除一个文件系统
[root@ceph-manager ~]# ceph fs rm jicki --yes-i-really-mean-it

客户端挂载 cephFS

安装 ceph-fuse:
[root@node-94 ~]# yum install ceph-fuse -y

创建挂载目录:
[root@node-94 ~]# mkdir -p /opt/jicki
[root@node-94 ~]# ceph-fuse /opt/jicki
[root@node-94 ~]# df -h|grep ceph
ceph-fuse 1.6T 25G 1.6T 2% /opt/jicki

基于 docker ceph-rbd-volume-plugin

六、ceph 相关命令:

一、manager 篇

查看实时的运行状态信息:
[root@ceph-manager ~]# ceph -w

查看状态信息:
[root@ceph-manager ~]# ceph -s

查看存储空间:
[root@ceph-manager ~]# ceph df

删除某个节点的所有的ceph数据包:
[root@ceph-manager ~]# ceph-deploy purge ceph-mon-1
[root@ceph-manager ~]# ceph-deploy purgedata ceph-mon-1

为ceph创建一个admin用户并为admin用户创建一个密钥,把密钥保存到/etc/ceph目录下:
[root@ceph-manager ~]# ceph auth get-or-create client.admin mds 'allow' osd 'allow *' mon 'allow *' -o /etc/ceph/ceph.client.admin.keyring

为osd.ceph-osd-1创建一个用户并创建一个key
[root@ceph-manager ~]# ceph auth get-or-create osd.ceph-osd-1 mon 'allow rwx' osd 'allow *' -o /etc/ceph/keyring

为mds.ceph-mon-1创建一个用户并创建一个key
[root@ceph-manager ~]# ceph auth get-or-create mds.ceph-mon-1 mon 'allow rwx' osd 'allow *' mds 'allow *' -o /etc/ceph/keyring

查看ceph集群中的认证用户及相关的key
[root@ceph-manager ~]# ceph auth list

删除集群中的一个认证用户
[root@ceph-manager ~]# ceph auth del osd.0

查看集群健康状态详细信息
[root@ceph-manager ~]# ceph health detail

查看ceph log日志所在的目录
[root@ceph-manager ~]# ceph-conf --name mds.ceph-manager --show-config-value log_file

二、mon 篇

查看mon的状态信息
[root@ceph-manager ~]# ceph mon stat

查看mon的选举状态
[root@ceph-manager ~]# ceph quorum_status --format json-pretty

看mon的映射信息
[root@ceph-manager ~]# ceph mon dump

删除一个mon节点
[root@ceph-manager ~]# ceph mon remove ceph-mon-1

获得一个正在运行的mon map,并保存在mon-1-map.txt文件中
[root@ceph-manager ~]# ceph mon getmap -o mon-1-map.txt

查看mon-1-map.txt
[root@ceph-manager ~]# monmaptool --print mon-1-map.txt

把上面的mon map注入新加入的节点
[root@ceph-manager ~]# ceph-mon -i ceph-mon-3 --inject-monmap mon-1-map.txt

查看mon的socket
[root@ceph-manager ~]# ceph-conf --name mon.ceph-mon-1 --show-config-value admin_socket

查看mon的详细状态
[root@ceph-mon-1 ~]# ceph daemon mon.ceph-mon-1 mon_status

删除一个mon节点
[root@ceph-manager ~]# ceph mon remove ceph-mon-1

三、msd 篇

查看msd状态
[root@ceph-manager ~]# ceph mds dump

删除一个mds节点
[root@ceph-manager ~]# ceph mds rm 0 mds.ceph-mds-1

四、osd 篇

查看ceph osd运行状态
[root@ceph-manager ~]# ceph osd stat

查看osd映射信息
[root@ceph-manager ~]# ceph osd stat

查看osd的目录树
[root@ceph-manager ~]# ceph osd tree

down掉一个osd硬盘 (ceph osd tree 可查看osd 的硬盘信息,下面为down osd.0 节点)
[root@ceph-manager ~]# ceph osd down 0

在集群中删除一个osd硬盘
[root@ceph-manager ~]# ceph osd rm 0

在集群中删除一个osd 硬盘 并 crush map 清除map信息
[root@ceph-manager ~]# ceph osd crush rm osd.0

在集群中删除一个osd的host节点
[root@ceph-manager ~]# ceph osd crush rm ceph-osd-1

查看最大osd的个数
[root@ceph-manager ~]# ceph osd getmaxosd

设置最大的osd的个数(当扩大osd节点的时候必须扩大这个值)
[root@ceph-manager ~]# ceph osd setmaxosd 10

设置osd crush的权重 ceph osd crush set <ID> <WEIGHT> <NAME> ID WEIGHT NAME 使用 ceph osd tree 查看
[root@ceph-manager ~]# ceph osd crush set 1 3.0 host=ceph-osd-1

设置osd 的权重 ceph osd reweight <ID> <REWEIGHT>
[root@ceph-manager ~]# ceph osd reweight 1 0.5

把一个osd节点踢出集群
[root@ceph-manager ~]# ceph osd out osd.1

把踢出的osd重新加入集群
[root@ceph-manager ~]# ceph osd in osd.1

暂停osd (暂停后整个集群不再接收数据)
[root@ceph-manager ~]# ceph osd pause

再次开启osd (开启后再次接收数据)
[root@ceph-manager ~]# ceph osd unpause

五、 PG 篇

查看pg组的映射信息
[root@ceph-manager ~]# ceph pg dump |more

查看一个PG的map
[root@ceph-manager ~]# ceph pg map 0.3f

查看PG状态
[root@ceph-manager ~]# ceph pg stat

查询一个pg的详细信息
[root@ceph-manager ~]# ceph pg 0.39 query

查看pg中stuck的状态 (如有非正常pg会显示)
[root@ceph-manager ~]# ceph pg dump_stuck unclean
[root@ceph-manager ~]# ceph pg dump_stuck inactive
[root@ceph-manager ~]# ceph pg dump_stuck stale

显示一个集群中的所有的pg统计
[root@ceph-manager ~]# ceph pg dump --format plain|more

恢复一个丢失的pg (og-id 为丢失的pg, 使用ceph pg dump_stuck inactive|unclean|stale 查找)
[root@ceph-manager ~]# ceph pg {pg-id} mark_unfound_lost revert

六、pool 篇

查看ceph集群中的pool数量
[root@ceph-manager ~]# ceph osd lspools

查看 PG组 号码:
[root@ceph-manager ~]# ceph osd pool get rbd pg_num

在ceph集群中创建一个pool
[root@ceph-manager ~]# ceph osd pool create test 100 (名称为 test, 100为PG组号码)

为一个ceph pool配置配额
[root@ceph-manager ~]# ceph osd pool set-quota test max_objects 10000

显示所有的pool
[root@ceph-manager ~]# ceph osd pool ls

在集群中删除一个pool
[root@ceph-manager ~]# ceph osd pool delete test test --yes-i-really-really-mean-it

显示集群中pool的详细信息
[root@ceph-manager ~]# rados df

给一个pool创建一个快照
[root@ceph-manager ~]# ceph osd pool mksnap test test-snap

删除pool的快照
[root@ceph-manager ~]# ceph osd pool rmsnap test test-snap

查看data池的pg数量
[root@ceph-manager ~]# ceph osd pool get test pg_num

设置data池的最大存储空间(默认是1T, 1T = 1000000000000, 如下为100T)
[root@ceph-manager ~]# ceph osd pool set test target_max_bytes 100000000000000

设置data池的副本数
[root@ceph-manager ~]# ceph osd pool set test size 3

设置data池能接受写操作的最小副本为2
[root@ceph-manager ~]# ceph osd pool set test min_size 2

查看集群中所有pool的副本尺寸
[root@ceph-manager ~]# ceph osd dump | grep 'replicated size'

设置一个pool的pg数量
[root@ceph-manager ~]# ceph osd pool set test pg_num 100

设置一个pool的pgp数量
[root@ceph-manager ~]# ceph osd pool set test pgp_num 100

查看ceph pool中的ceph object (volumes 为pool名称)(这里的object是以块形式存储的)
[root@ceph-manager ~]# rados ls -p volumes | more

创建一个对象object
[root@ceph-manager ~]# rados create test-object -p test

查看object
[root@ceph-manager ~]# rados -p test ls

删除一个对象
[root@ceph-manager ~]# rados rm test-object -p test

查看ceph中一个pool里的所有镜像 (volumes 为pool名称)
[root@ceph-manager ~]# rbd ls volumes

在test池中创建一个命名为images的1000M的镜像
[root@ceph-manager ~]# rbd create -p test --size 1000 images
查看刚创建的镜像信息
[root@ceph-manager ~]# rbd -p test info images

删除一个镜像
[root@ceph-manager ~]# rbd rm -p test images

调整一个镜像的尺寸
[root@ceph-manager ~]# rbd resize -p test --size 2000 images

给镜像创建一个快照 (池/镜像名@快照名)
[root@ceph-manager ~]# rbd snap create test/images@images1

删除一个镜像文件的一个快照
[root@ceph-manager ~]# rbd snap rm 快照池/快照镜像文件@具体快照

如果删除快照提示保护,需要先删除保护
[root@ceph-manager ~]# rbd snap unprotect 快照池/快照镜像文件@具体快照

删除一个镜像文件的所有快照
[root@ceph-manager ~]# rbd snap purge -p 快照池/快照镜像文件

把ceph pool中的一个镜像导出
[root@ceph-manager ~]# rbd export -p images --image <具体镜像id> /tmp/images.img