文件名称:什么是数据归档-qca6410电力猫原理图
文件大小:2.93MB
文件格式:PDF
更新时间:2024-06-28 10:35:48
大数据管理 数据集成 技术 方法 最佳实践
第9章 数据归档 9.1 什么是数据归档 到目前为止,在数据管理中还没有重点强调的就是数据生命周期的末端,即数据被归档或者归档之后被删 除。这样做的原因在于,通常人们希望在技术方案的能力范围之内存储尽可能多的数据,如果没有办法保存所有 的数据时,就只有备份旧数据之后删除。现在,在大数据时代,所产生的数据以指数级增长,因此,将数据进行 归档并恢复的能力就尤为重要。而且,更加重要的是,由于通常不能提供选择性恢复的功能,数据备份通常并不 能完全承担数据归档的责任,同时,在当前数据结构发生改变或者应用系统及技术栈被淘汰时,备份的数据将失 去其有效性。 数据归档假设将数据移动到成本低廉(可能访问也受限)的平台上,并且这个平台可以提供数据的后继恢复 或者访问——要么将数据恢复到原来的应用程序,或者在归档环境下直接访问数据。 对于所有的组织来说,数据归档都是一个需要关注的重要领域。而在发生合并和并购、系统整合,以及应用 程序替换的场合下,数据归档就更显得特别重要。对于部分数据不能被转换到新环境的那些数据转换,数据归档 也是比较重要的,特别是那些高度监管的行业。 非结构化数据,如电子邮件和文档,通常需要大量使用归档技术,这是因为,大量数据一旦过期之后就很少 会被再次访问,同时也没有一个数据删除的策略。电子邮件和文档管理系统通常都内置了数据归档和恢复功能, 也有一些第三方工具致力于归档非结构化数据。