服务器数据恢复环境:
IBM AIX系统;
存储由4个PV组成1个VG,VG中划分了5个文件系统:2个JFS2,2个JFS2LOG,1个JFS,两个JFS2中重要的一个JFS2由2组LV条带化后组成;
存储中存放的是由ORACLE数据库组织的某单位交管系统的重要数据。
服务器故障&分析:
因业务需要新增应用服务器,管理员不小心将4个PV MAP到新环境,然后删除全部LV后重新做了4个LV并生成文件系统。生产环境报错后又试图重建回原始的LV结构,导致对数据的进一步破坏。
需要恢复数据的文件系统中有200多个ORACLE数据文件。
服务器数据恢复过程:
1、对故障服务器的磁盘做完整镜像备份,后续的数据恢复操作都在镜像文件上进行,避免对原始数据造成二次破坏。
2、基于镜像备份文件在每个PV内部分析PP的参数,再按照PP之间的关系分析LP。经过仔细分析,北亚数据恢复工程师发现PP的连续性较差。和管理员沟通后得知故障服务器中的文件系统做过多次扩容。
3、分析PP与LP MAP后,发现由于条带化,整个结构更加复杂,很难拼接出完整的文件系统。
4、按照ORACLE数据文件内部结构在4个PV中进行全面地分析、整理,发现PP碎片极多,ORACLE数据文件也很乱。
5、通过对PP MAP与ORACLE的关联特征,北亚数据恢复工程师研究出部分对应算法。通过此算法整理出多数LP-PP映射表,对剩余部分进行手工的核对,最终将文件系统完整拼接出来。
6、对文件系统进行解释,发现文件系统前面破坏严重,原文件系统超级块、元数据(包括节点)全部丢失。
7、在文件系统中搜索所有索引块,按索引块恢复部分数据文件。其余丢失索引块的数据文件按ORACLE数据文件内部结构进行分析与重组。
服务器数据恢复结论:
历时2天完成数据恢复任务,经过用户亲自检验,仅2个数据文件因后写入导致部分记录破坏,其他数据都成功恢复。