【VSAN数据恢复】VSAN数据重构迁移失败的数据恢复案例

时间:2024-01-26 16:26:45

VSAN简介:
VSAN存储是一个对象存储,以文件系统呈现给在vSphere主机上。这个对象存储服务会从VSAN集群中的每台主机上加载卷,将卷展现为单一的、在所有节点上都可见的分布式共享数据存储。
对于虚拟机来说,只有一个数据存储,这个分布式数据存储来自VSAN集群中每一台vSphere主机上的存储空间,通过磁盘组进行配置,在单独的存储中存放所有的虚拟机文件。这种数据存储方式比较安全,当闪存盘或者容量盘出现故障的时候,数据会向其他节点转移,在转移过程中有可能出现故障。

VSAN数据恢复环境&故障:
4台服务器节点组建的VSAN集群,每台服务器节点上有两个磁盘组,每个磁盘组由一个SSD硬盘(闪存盘)带数块SAS硬盘(容量盘)。
VSAN集群中一个服务器节点上的一个磁盘组中的容量盘出现故障离线,VSAN进行数据重构迁移,在数据转移过程中机房突然停电,数据迁移中断没有完成。恢复通电后,该节点上另外一个磁盘组中又有2块容量盘离线,整个存储出现故障。虽然VSAN管理控制台可以登录,但是所有虚拟机都无法访问。

VSAN数据恢复过程:
1、将四个服务器节点上所有硬盘编号后取出,由硬件工程师对所有磁盘进行硬件故障检测,经过检测没有发现有磁盘存在硬件故障。将所有磁盘以只读模式进行全盘镜像,镜像完成后将所有磁盘按照编号还原到原服务器中,后续的数据分析和数据恢复操作都基于镜像文件进行,避免对原始磁盘数据造成二次破坏。
2、基于镜像文件分析底层数据,分析VSAN存储结构,获取虚拟机所在硬盘的分布信息。北亚企安数据恢复工程师通过分析出来的数据存储结构开发程序测试数据分布信息的准确性。
3、单独分析每个服务器节点上的两个磁盘组,弄清楚磁盘组内闪存盘和容量盘之间的对应关系。每块硬盘都有一个唯一标识进行磁盘间的对应,根据硬盘的ID信息来判读磁盘组中硬盘ID信息。
4、在每块硬盘上获取磁盘的UUID和磁盘组的UUID。
5、根据每个磁盘组中的容量盘组件信息获取此容量盘组件信息。
6、根据容量盘组件信息中记录的组件的MAP位置提取组件位图。
7、根据组件位图提取组件数据和缓存数据。
8、根据组件的描述信息获取组件所属对象及组件顺序,并把组件合并成对象。
9、根据对象提取数据。
10、数据提取完成后对恢复出来的数据进行检测。经过检测,所有恢复出来的虚拟机都可以正常启动。用户方认可本次数据恢复结果。本次VSAN数据恢复工作结束。

VSAN数据恢复总结:
VSAN对象可以看成一个卷,也可以理解成是一个逻辑卷,每个存在于数据存储上的VSAN对象都是由多个组件构成,这些组件分布于集群主机上的磁盘组中。在恢复vsan数据的过程中,获取组件信息是最关键的,因为组件是每个对象的重要组成部分。