目录
第一章 灾备行业基础知识概述
1.1 灾备的重要性
1.2 数据备份
1.3 灾难恢复衡量指标
1.4 灾备的三个等级
1.4.1 数据级灾备
1.4.2 应用级灾备
1.4.3 业务级灾备
1.4.4 三种灾备等级的 RTO 与 TCO 对比
第二章 灾备关键技术分类
2.1 数据复制技术
2.1.1 基于主机操作系统的数据复制
2.1.2 基于应用和中间层的数据复制技术
2.1.3 基于数据库的数据复制技术
2.1.4 基于存储系统的网关的数据复制
2.1.5 基于存储介质的数据复制
2.1.6 同步与异步复制方式
2.1.7 快照技术
2.1.8 数据一致性
2.2 切换技术
2.2.1 网络切换技术
2.2.2 应用切换技术
2.3 重复数据删除技术
2.4 数据加密与传输技术
2.4.1 源端加密
2.4.2 传输加密
2.5 三种常见存储形态及对应架构
2.5.1 块存储与直接附加存储
2.5.2 文件存储与网络附加存储 (NAS)
2.5.3 对象存储与分布式存储架构
第一章 灾备行业基础知识概述
1.1 灾备的重要性
美国德克萨斯州大学的较早的一次调查显示 :“只有 6% 的公司
可以在数据丢失后生存下来、43% 的公司会彻底关门、51% 的公司会在两
年之内消失。”
另一份针对这一课题的研究报告也显示:在灾难之后,如果
无法在 14 天内恢复信息作业,有 75% 的公司业务会完全停顿,20% 的企业
在两年之内*宣告破产。美国明尼苏达大学的研究也表明,在遭遇灾难的
同时又没有灾难恢复计划的企业中,将有超过 60% 在两到三年后退出市场。
而随着企业对数据处理依赖程度的递增,该比例还有逐渐上升的趋势。
IDC 在全球范围内,
针对多个行业的中小型企业(员工数小于 1000 名)
的调研显示,近 80%的公司预计每小时的停机成本至少在 2 万美元以上,
而超过 20%的企业估算其每小时的停机成本至少为 10 万美元。
2016 年灾备行业的一份可用性报告显示:企业每年因应用停机所造成
的损失达到 1600 万美元,可用性差距进一步扩大。
报告指出,尽管去年发
生了诸多备受瞩目的停机事件,但依然没有引起足够的重视。全球 84% 的
资深 IT 决策者(ITDMs)承认,他们正在经历“可用性差距”的困境,这
一数字较之 2014 年增长了 2%。
1.2 数据备份
数据备份是容灾的基础,是指为防止系统出现操作失误或系统故障导致
数据丢失,而将全部或部分数据集合从应用主机的硬盘或阵列复制到其它存
储介质的过程。
按照备份数据量,可以分为:全量备份、增量备份、差量备份。
全量备份——用存储介质对整个数据及系统进行完全备份。这种备份方
式的好处是很直观,容易被人理解,易恢复;缺点是在备份数据中有大量重
复数据,由于需要备份的数据量相当大,因此备份所需时间较长。
增量备份——每次备份的数据只是相当于上一次备份后增加和修改后的
数据。这种备份的优点很明显:重复数据少,即节省磁带空间,又缩短了备
份时间;缺点在于当发生灾难时,数据恢复比较麻烦。
差量备份——是拷贝所有新产生或更新的数据,这些数据都是最近一次
全量备份后产生或更新的。
增量备份与差量备份的区别是,增量备份判断数据更新标准是依据上一
次备份检查点,而差量备份一定是依据全量备份检查点。如没有全量备份,
就没有差量备份。差量备份的主要目的是限制完全恢复时使用的介质数量。
本地容灾,一般指主机集群,当某台主机出现故障,不能正常工作时,
其他的主机可以替代该主机,继续进行正常的工作。
异地容灾,是指在与生产机房有一定距离的异地建立与生产机房类似的
信息平台(备份中心),并采用特定的技术将生产中心的数据传输到该备份
中心,从而在生产中心发生较大的灾难如火灾或地质灾害时,仍能对生产数
据进行保护的容灾系统。
备份与容灾的区别:备份是为了应对灾难来临时造成的数据丢失问题,
容灾是为了在遭遇灾害时能保证信息系统能正常运行,帮助企业实现业务连
续性的目标。
1.3 灾难恢复衡量指标
RTO(Recovery Time Objective)恢复时间目标
在运行中断情况下,基于可接受的停机时间和可接受的性能水平所制定
的重建和恢复功能或资源的时间目标。根据标准定义,RTO 是从中断时刻
到恢复至可接受水平所需的时间,这不仅包含了容灾恢复的时间,还包含了
宣布灾难之前的应急处置和判断决策等时间。而且 RTO 针对的是造成中断
的事件,并不一定是灾难事件。RTO 值越小就意味着所要求的恢复能力越强。
RPO(Recovery Point Objective)恢复点目标
为使活动能够恢复进行,而必须将该活动所用的信息恢复到某时间点。
“恢复点”是指中断前最后一次备份数据的时间点,这意味着当需要恢复时
所需修复或追补的数据量。如果 RPO 等于零,就意味着要求数据零丢失。
否则为了恢复业务处理,就需要对丢失数据进行修复或追补。
RTO 针对的是服务丢失,RPO 针对的是数据丢失,两者是衡量容灾系
统有两个主要指标,但它们没有必然的关联性。
1.4 灾备的三个等级
1.4.1 数据级灾备
数据级灾备强调数据的备份和恢复,包括数据的复制、备份、恢复等在
内的数据级灾备是所有灾备工作的基础。在灾备恢复的过程中,数据恢复是
最底层的,比如数据必须完整一致后数据库才能启动,之后才是启动应用程
序,应用服务器接管完成后,才能进行网络的切换。这个流程需要严格的执
行才能确保灾备的顺利切换。很多应用在切换的过程中之所以会失败,数据
“没起来”是其中一个重要的因素之一。
数据级灾备的关注点在于数据,即灾难发生后可以确保用户原有的数据
不会丢失或者遭到破坏。较低级的数据级灾备可通过将需要备份的数据用人
工方式保存到异地来实现,比如将备份的磁带定时运送到异地保存。较高级
的数据灾备方案则依靠基于网络的数据复制工具,实现生产中心和灾备中心
之间的异步 / 同步的数据传输,比如采用基于磁盘阵列的数据复制功能(基
于数据库的复制方式可分为实时复制、定时复制和存储转发复制)。
1.4.2 应用级灾备
应用级灾备强调应用的具体功能接管,它提供比数据级灾备更高级别的
业务恢复能力,同时也是业务级灾备的基础,只有具体应用得到恢复,后续
的业务才能有效进行。
应用级灾备是在数据级灾备的基础上把应用处理能力再复制一份,也就
是在异地灾备中心再构建一套支撑系统。该支撑系统包括数据备份系统、备
用数据处理系统、备用网络系统等部分。应用级灾备需要具备提供应用接管
的能力,即在生产中心发生故障的情况下,能够在灾备中心接管应用,从而
尽量减少系统停机时间,提高业务连续性。
1.4.3 业务级灾备
业务级灾备是*别的灾备建设,如果说数据级灾备、应用级灾备都
是在 IT 系统的范畴之内,业务级灾备则是在以上两个等级的灾备基础上,
还需考虑到 IT 系统之外的业务因素,包括备用办公场所、办公人员等,而
且业务级灾备通常对支持业务的 IT 系统会有更高的要求(RTO 在分钟级)。
1.4.4 三种灾备等级的 RTO 与 TCO 对比
第二章 灾备关键技术分类
2.1 数据复制技术
数据复制技术是容灾方案设计中最基本也是核心的技术之一,主要分为
基于数据库 / 应用的复制、基于主机的数据复制、基于存储网络的数据复制、
基于存储的数据复制。其中,除了基于数据库的数据复制以外,其他的数据
复制方式都具有同步和异步两种复制方式。
2.1.1 基于主机操作系统的数据复制
基于主机的数据复制是通过磁盘卷的镜像或复制进行的,业务进行在主
机的卷管理器这一层,对硬件设备尤其是存储设备的限制小,利用生产中心
和备份中心的主机系统通过 IP 网络建立数据传输通道,数据传输可靠,效
率相对较高;通过主机数据管理软件实现数据的远程复制,当主数据中心的
数据遭到破坏时,可以随时从备份中心恢复应用或从备份中心恢复数据。
基于主机的数据复制不需要两边采用同样的存储设备,具有较大的灵活
性,缺点是复制功能会占用一些主机的 CPU 资源,对软件要求较高(很多
软件无法提供基于时间点的快照功能),对主机的性能有一定的影响。
为了避免上述复制问题,提高复制效率
2.1.2 基于应用和中间层的数据复制技术
应用层面的数据复制通过应用程序与主备中心的数据库进行同步或异步
的写操作,以保证主备中心数据一致性,灾备中心可以和生产中心同时正常
运行,既能容灾,还可实现部分功能分担,但是该技术的实现方式复杂,与
应用软件业务逻辑直接关联,实现和维护难度较高,并且使用应用层面的数
据复制会提高系统的风险与数据丢失的风险。
独立于底层的操作系统、数据库、存储,应用可以根据需求实现双写或
者多写,从而实现主本和多个数据副本之间的数据复制功能。这种由应用实
现的技术,可以在中间件或者应用平台层面进行封装和实现,对上面的应用
透明,也可以在应用层面实现;主要好处是可根据需求定制、可实现应用和
数据库层面的复制,自主可控;主要不足是目前市场上没有成熟、适合传统
IT 企业大规模推广使用的中间件产品;如果完全由应用封装平台或者应用
来实现,代码的复杂程度提高,增加了应用的维护成本。
2.1.3 基于数据库的数据复制技术
基于数据库软件的复制技术包括物理复制和逻辑复制两种方式,逻辑复
制是利用数据库的重做日志、归档日志,将主本所在站点的日志传输到副本
所在站点,通过重做 SQL 的方式实现数据复制。逻辑复制只提供异步复制,
主副本数据的最终一致性,无法保证实时一致性;物理复制不是基于 SQL
Apply 操作来完成复制,而是通过 redolog 日志或者归档日志在副本站点的
同步或者异步持久化写来实现复制功能,同时副本站点的数据可以提供只读
功能。
开放平台数据库复制技术则是一种基于数据库 log( 日志 ) 的结构化数据
复制技术,它通过解析源数据库在线 log 或归档 log 获得数据的增、删、改变化,
再将这些变化应用到目标数据库,使源数据库与目标数据库同步,以达到多
站点间数据库可双活甚至多活,实现业务连续可用和容灾的目的。
2.1.4 基于存储系统的网关的数据复制
2.1.5 基于存储介质的数据复制
2.1.6 同步与异步复制方式
根据内部实现机制的不同,又可以将复制技术分为同步和异步复制两种方式:
同步复制方式
在主 / 备中心的磁盘阵列同步进行数据的更新,应用系统的 I/O 写入主
磁盘阵列后,主磁盘阵列将利用自身的机制,同时将写 I/O 写入后备磁盘阵
列,后备磁盘阵列确认后,主中心磁盘阵列才返回应用的写操作完成信息。
异步复制方式
在应用系统的 I/O 写入主磁盘阵列后,主磁盘阵列立即返回给主机应用
系统“写完成”信息,主机应用可以继续进行读、写 I/O 操作。同时,主中
心磁盘阵列将利用自身的机制将写 I/O 写入后备磁盘阵列,实现数据保护。
采用同步复制方式,使得后备磁盘阵列中的数据总是与生产系统数据同
步,因此当生产数据中心发生灾难事件时,不会造成数据丢失。但代价是生
产和灾备中心之间必须建立高速低延迟光纤网络,任何灾备存储访问延迟都
会对生产系统造成延滞效应。因此,为避免对生产系统性能的影响,同步方
式通常在近距离范围内(FC 连接通常是 200KM 范围内,实际用户部署多在
35KM 左右)。
采用异步复制方式应用程序不必等待远程更新的完成,因此远程数据备
份对性能的影响通常较小,并且备份磁盘的距离和生产磁盘间的距离,在理
论上没有限制(可以通过 IP 连接来实现数据的异步复制)。
2.1.7 快照技术
SNIA( 全 球 网 络 存 储 工 业 协 会 Storage Networking Industry Association)
对快照 (Snapshot) 的定义是关于指定数据集合的一个完全可用拷贝,该拷贝
包括相应数据在某个时间点 ( 拷贝开始的时间点 ) 的映像。
快照可以是其所表示的数据的一个副本,也可以是数据的一个复制品。
从具体的技术细节来讲,快照是指向保存在存储设备中的数据的引用标记或
指针,换句话说,快照类似详细的目录表,但它被计算机作为完整的数据备
份来对待。
快照的一个主要作用是能够进行在线数据恢复,当存储设备发生应用故
障或者文件损坏时可以进行及时数据恢复,将数据恢复成快照产生时间点的
状态;另一个作用是为存储用户提供额外的数据访问通道,当原数据进行在线应用处理时,用户可以访问快照数据,还可以利用快照进行测试等工作。
快照在备份、数据保护过程中发挥的作用越来越大。快照技术具有备份
和恢复窗口短、性能损失小、容量利用率高等优点。因此,所有存储系统,
不论高中低端,只要应用于在线系统,那么快照就成为一个不可或缺的功能。
目前主流的快照技术包括镜像分裂快照技术、按需备份快照技术、指针重映
射快照技术、增量快照技术等。
快照有三种基本形式:基于文件系统式、基于子系统式、基于卷管理器
虚拟化式,这三种形式存在较大差别。目前,市场上也出现了一些能够自
动生成这些快照的实用工具。
数据的迁移离不开数据复制技术,在机房搬迁、停机整改、数据上云等
数据迁移场景中,虽然各种数据复制技术都可以实现数据的最终迁移,但是
在综合数据迁移两端存储异构、生产是否停机、数据一致性等因素时,优秀
的复制技术能够帮助用户节省成本,将迁移工作简单化、透明化。
2.1.7 归档技术
归档是把不常访问的数据迁移到其他存储设备上。迁移后可以选择在原系统中留下归档存根,用户通过对归档存根直接访问,自动回调归档数据,从而实现透明访问归档数据。
归档的特点包括改变了系统中的数据及状态;可大量节省在线存储空间,提高在线存储性能;提高备份/恢复速度,并节省备份介质。归档的主要应用对象:文件系统: NAS;邮件系统: MS Exchange、 Lotus Domino;文档系统: SharePoint等。
归档的技术路线是先设定一个时间线,把文件分成常用数据和历史数据两个部分;其次要定期进行归档操作,把历史数据存放于归档存储,归档后的文件/邮件在原处可留下存根;用户访问存根,归档文件/邮件自动回调;最后,归档后,只需要对常用数据进行备份,大大减少备份数据量;同理,只要恢复常用数据,系统就能工作,大大降低恢复时间。
2.1.8 数据一致性
主本和副本之间根据需求可以是强一致性、弱一致性、最终一致性,不
同的需求决定了不同的解决方案,如下:
1) 强一致性
主本和副本的更新在同一个事务中完成,通过 2PC 的分布式事务控制
来保证数据的强一致性,如标准的 JTA 协议;如果应用自行设计,可以考
虑先更新副本、再更新主本,如果副本失败,则事务直接返回失败,如果是
副本成功、主本失败,则设置主本重试次数,尝试数次不成功之后,副本执
行回滚操作,事务返回失败;强一致性的操作有点类似前面介绍的同步模
式复杂,在事务层面严格保证 ACID 特性,数据的主本和副本之间耦合性增
加,性能受副本所在站点的性能、网络带宽、网络延时的影响;同时在事务
的控制方面增加了应用的复杂度(即使使用中间件产品中自带的分布式事务
功能),在某些异常情况下会出现可疑事务,必要时需要人工干预。
2) 弱一致性
系统并不保证主副本数据之间的实时一致性,不承诺具体到多久之后在
副本可以读到最新的数据。
3) 最终一致性
弱一致性的特定形成,在主本数据后续更新的前提下,副本最终与上一
次主本最新的值保持一致。在没有故障发生的前提下,主副本之间的时延主
要受通讯延时、系统负载、和复制副本的个数影响。
2.2 切换技术
切换(Failover)技术是指在早前运行系统故障或异常终止后,能够自
动 ( 通常无需人工干预或警告 ) 切换到冗余或备用信息系统的能力。根据具
体突发故障的不同,又可以归类为网络切换和应用切换。
2.2.1 网络切换技术
网络切换技术主要有三种:基于 IP 地址的切换、基于 DNS 服务器的切换、基于负载均衡设备的切换。
1)基于 IP 地址的切换
主备应用服务器的 IP 地址空间相同,客户端通过唯一的 IP 地址访问应
用服务器。在正常情况下,只有生产中心应用服务器的 IP 地址处于可用状态,
灾备中心的备用服务器 IP 地址处于禁用状态。灾难一旦发生,管理员手动
或通过脚本将灾备中心服务器的 IP 地址设置为可用,实现网络访问路径切
换。
2)基于 DNS 服务器的切换
DNS 服务器的切换模式下,所有应用都需要根据主机名来访问,而不
是直接根据主机的 IP 地址来访问,从而通过域名实现网络切换。组织对外
提供服务的业务,可通过向运营商申请相应的 DNS 服务器,对主生产中心
和备用生产中心各申请相应的 DNS 服务,通过运营商 DNS 切换机制实现对
外服务的切换。
对于内部提供的业务,生产中心和灾备中心各自部署一台 DNS 服务器,
负责所有主机的域名解析。生产中心为主 DNS 服务器,灾备中心为备份
DNS 服务器,两台 DNS 服务器的内容自动保持完全同步。对于每个应用服
务器的域名,DNS 服务器上可以保存两个 IP 地址,主 IP 地址指向生产中心
应用服务器的 IP 地址,备份 IP 地址指向灾备中心服务器的 IP 地址。
在所有的客户端上设置这两个 DNS 服务器(可通过 DHCP 服务器自动
分配)。系统首先查询主 DNS 服务器,如果没有应答,就查询备份 DNS 服
务器。当生产中心的主服务器出现故障,主 DNS 服务器发现无法联系到主
服务器时,会自动将 DNS 请求解析至灾备中心服务器的 IP 地址,从而实现
单个应用的自动切换。
3)基于负载均衡设备的切换
通过在服务器集群前端部署一台负载均衡设备,根据已配置的均衡策略
将请求在服务器集群中分发,为用户提供服务,并对服务器可用性进行维护。
负载均衡能够按照一定的策略分发到指定的服务器集群中的服务器,或
指定链路组的某条链路上,调度算法以用户连接为粒度,并且可以采取静态
设置或动态调配的方式。
负载均衡设备能够针对各种应用服务状态进行探测,收集相应信息作为
选择服务器或链路的依据,包括 ICMP、TCP、HTTP、FTP、DNS 等。通过
对应用协议的深度识别,能够对不同业务在主生产中心和灾备中心之间进行
切换。
2.2.2 应用切换技术
应用切换是指生产中心由于发生灾难无法作业时,可由灾备中心的备用
服务器提供业务接管, 确保业务运行的高连续性。实现应用切换的前提条
件是:
1)数据已经从生产中心同步到灾备中心,如果数据复制采用的是异步
的方式,在网络故障的情况下,就有可能造成数据不一致的问题,导致数据
不可用或无法访问。
2)灾备中心配置与生产中心对应的应用软件服务器、数据库服务器和
中间件服务器等,且运行正常。
3)灾备中心网络运行正常或能够实现正常切换。
应用切换技术主要有以下几种:
1. 主备集群 (Cluster) 远程技术
集群远程是指通过在生产中心和灾备中心的应用服务器上安装远程集群
软件,实现跨广域的多服务器状态的监控,当发生灾难时,实现应用服务器
2. 双活负载均衡技术
归类到应用切换功能,双活技术是一种利用 IT 资源较多的灾备方案,
来源于多中心技术。真正意义的双活指两个数据中心同时处于生产状态,类
似于负载均衡技术,但通常的负载均衡针对于业务流量而非数据保护和数据
安全,启用所有资源共同承载业务的服务,同时保证了当其中一边发生灾害
事件时,另一方的资源可直接接管所有的业务服务。
双活可以保证资源的充分利用和快速的灾备切换,是快速安全的应用级
灾备策略,主要用于同城灾备系统。异地双活系统则由于需要考虑系统的合
理拆分、数据复制和业务服务的协调、灾备接管策略等,因此也被称为最为
复杂的灾备技术架构。
双活技术架构按照业务分担方式,可以分为纯双活系统和准双活系统。
纯双活系统为全业务负荷在双活中心的共同承载,在实践中多演变为按照区
域负载分担或者按照业务类型负载分担。准双活系统则往往以读写分离的形
式存在,由生产中心承载全业务,备份中心则承载可分离的读类型业务,从
而较大幅度地利用备份中心的资源并且提升业务切换的指标。因此,从应用
切换的角度来解释双活,它更多地属于一种负载均衡技术,而非容灾技术。
2.3 重复数据删除技术
数据去重技术通常用于基于磁盘的备份系统,通过在某个时间周期内删
除不同文件中不同位置的重复可变大小数据块,减少存储系统中使用的存储
容量。基于磁盘的重复数据删除技术已经被大量应用于灾备存储中,该项技
术通过寻找不同数据块中的冗余数据,并通过删除这些重复的数据来对数据
进行压缩,某些重复数据压缩技术甚至实现了 20:1 的压缩比,通过重复数
据删除技术不但能解决单数据中心多副本占用空间的问题,还可以减少传输
备份数据所需要的带宽,重复数据删除技术主要分为基于软件的重复数据删
除和基于硬件的重复数据删除两种方式。
基于软件的重复数据删除旨在消除源端的冗余,以此减少带宽的压力。
但是,基于软件的重复数据删除维护十分困难,如果想用一个全新的产品来
替换原有的备份引擎,就会导致之前的数据完全不可用。
基于硬件的重复数据删除在存储系统本身进行数据削减,具有更高的压
缩比,更加适合大型企业使用。正常情况下,备份软件会将专用设备看成一
般的“磁盘系统”,并且不会感知其内部正在进行的重复数据删除进程。具
有更高的压缩比,更加适合大型企业使用。
2.4 数据加密与传输技术
数据级灾备往往依托于多部门、多单位甚至是跨系统的综合协作,因此
数据在传输过程或存储介质上的安全性问题也会格外突出。
首先从备份数据存储安全性的角度来看,
备份数据如果在存储介质上以明文方式存放,容易被黑客攻击造成数据外泄。
其次,从备份数据传输安全性的角度来看,备份数据如果在网络传输过程中
以明文或不当的加密方式传输,容易通过数据包截取等手段造成备份数据泄
露。
2.4.1 源端加密
源端加密主要包括硬件加密和软件加密两种方式:硬件加密
技术一般所指的是采用硬件数据加密技术对产品硬件进行加密,具备防止暴
力破解、密码猜测、数据恢复等功能,实现方式有键盘式加密、刷卡式加密,
指纹式加密等。软件加密则是通过产品内置的加密软件实现对存储设备的加
密功能。实现方式主要有软件内密码加密、证书加密、光盘加密等。
2.4.2 传输加密
2.5 三种常见存储形态及对应架构
从定义上,存储和灾备并不属于同一领域,但灾备技术的发
展依托于存储技术的发展,数据备份的过程也必须涉及到数据的存储过程。
此外,随着市场竞争的加剧,灾备企业和存储企业之间的界限也逐渐
模 糊, 相 互 之 间 的 市 场 渗 透 也 在 不 断 加 剧。 因 此 谈 灾 备, 必 然 谈 存 储。
常 见 的 存 储 方 式 主 要 包 括:
DAS(Direct Attached Storage) 直 连 附 加 存 储、
SAN(Storage Area Network) 存 储 区 域 网 络
NAS(Network Attached Storage)网络附加存储、
OBS(Object-Based Storage)对象存储等。
2.5.1 块存储与直接附加存储
1)直连附加存储(DAS)
DAS 这种存储方式与普通的 PC 存储架构一样,外部存储设备都是直接
挂接在服务器内部总线上,数据存储设备是整个服务器结构的一部分。
2)存储区域网络(SAN)
SAN 存储方式创造了存储的网络化。存储网络化顺应了计算机服务器
体系结构网络化的趋势。SAN 的支撑技术是光纤通道 (FC Fiber Channel) 技
术。它是 ANSI 为网络和通道 I/O 接口建立的一个标准集成。FC 技术支持
HIPPI、IPI、SCSI、IP、ATM 等多种高级协议,其最大特性是将网络和设备
的通信协议与传输物理介质隔离开,这样多种协议可在同一个物理连接上同
时传送。
SAN 的硬件基础设施是光纤通道,用光纤通道构建的 SAN 由以下三个
部分组:
存储和备份设备——包括磁带、磁盘和光盘库等。
光纤通道网络连接部件——包括主机总线适配卡、驱动程序、光缆、集
线器、交换机、光纤通道和 SCSI 间的桥接器。
应用和管理软件——包括备份软件、存储资源管理软件和存储设备管理
软件。
SAN 的优点
1. 网络部署容易
2. 高速存储性能
因为 SAN 采用了光纤通道技术,所以它具有更高的存储带宽,存储性
能明显提高。SAn 的光纤通道使用全双工串行通信原理传输数据,传输速率
高达 1062.5Mb/s。
3. 良好的扩展能力
由于 SAN 采用了网络结构,扩展能力更强。光纤接口提供了 10 公里的
连接距离,这使得实现物理上分离,异地存储变得更为容易。
2.5.2 文件存储与网络附加存储 (NAS)
网络附加存储(NAS)方式则全面改进了以前 DAS 存储方式。它采用
独立于服务器,单独为网络数据存储而开发的一种文件服务器来连接所存储
设备,自形成一个网络。这样数据存储就不再是服务器的附属,而是作为独
立网络节点存在于网络之中,可由所有的网络用户共享。
NAS 的优点:
1. 真正的即插即用
NAS 是独立的存储节点存在于网络之中,与用户的操作系统平台无关,真正的即插即用。
2. 存储部署简单
NAS 不依赖通用的操作系统,而是采用一个面向用户设计的,专门用
于数据存储的简化操作系统,内置了与网络连接所需要的协议,因此使整个系统的管理和设置较为简单。
3. 存储设备位置非常灵活
4. 管理容易且成本低
NAS 数据存储方式是基于现有的企业 Ethernet 而设计的,按照 TCP/IP
协议进行通信,以文件的 I/O 方式进行数据传输。
当然,NAS 也并非十全十美,存储性能较低、可靠度低是其主要缺点。
2.5.3 对象存储与分布式存储架构
对象存储系统(Object-Based Storage System)是综合了 NAS 和 SAN 的
优点,同时具有 SAN 的高速直接访问和 NAS 的数据共享等优势,提供了高
可靠性、跨平台性以及安全的数据共享的存储体系结构。
分布式存储是利用分布式技术将标准 X86 服务器的本地 HDD、SSD 等
存储介质组织成一个大规模存储资源池,同时,对上层的应用和虚拟机提供
工业界标准的 SCSI、iSCSI 和对象访问接口,进而打造一个虚拟的分布式统
一存储产品。
2.7数据库分类及容灾
2.7.1.数据库分类
数据库是“按照数据结构来组织、存储和管理数据的仓库”,是一个长期存储在计算机内,有组织、可共享、统一管理的大量数据集合。数据库根据数据存储方式的不同,可划分为关系型数据库和非关系型数据库两大类。
关系数据库,是建立在“有关系”基础上的数据库,借助于集合代数等数学概念和方法来处理数据库中的数据。在关系型数据库中,对数据的操作几乎全部建立在一个或多个关系表格上。在大型系统中通常有多个表,且表之间有各种关系。实际使用就是通过对这些关联的表格分类、合并、连接或选取等运算来实现数据库的管理。常见的关系型数据库有 Oracle, DB2、 Microsoft SQLServer、 MySQL 等。
非关系型数据库,顾名思义,每条数据间都是独立存在的,不存在任何关系。
非关系型数据库严格意义上来说,并不是一种数据库,而是一种数据结构化存储方法的集合,类似于文档、键值对或者图结构。常见的非关系型数据库有NoSQL、 MongoDB、Redis、Hbase 等。
(1) Oracle 数据库
Oracle数据库是甲骨文公司推出以分布式数据库为核心的一组软件产品,是目前世界上使用最为广泛的数据库管理系统。作为一个通用的数据库系统,它具有完整的数据管理功能;作为一个关系数据库,它是一个完备关系的产品;作为分布式数据库,它实现了分布式处理功能。
(2) SQL Server 数据库
SQL Server是微软开发的商业数据库,是一个全面的数据库平台,使用集成的商业智能(BI)工具提供了企业级的数据管理。SQL Server数据库引擎为关系型数据和结构化数据提供了更安全可靠的存储功能,且具有使用方便可伸缩性好与相关软件集成程度高等优点。
(3) MySQL数据库MySQL 是最流行的关系型数据库管理系统之一,是一个关系型数据库管理系统。这种数据库将数据保存在不同的表中,而不是将所有数据放在一个大仓库内,这样就增加了读取的速度并提高了灵活性。MySQL所使用的SQL语言是用于访问数据库的最常用标准化语言。其体积小、速度快、总体拥有成本低,尤其是开放源码这一特点,一般中小型网站的开发都选择MySQL作为网站数据
(4) MongoDB 数据库
MongoDB 是一款为Web应用程序和互联网基础设施设计的数据库管理系统,是一款非关系型数据库。MongoDB使用BSON (类JSON)作为其数据模型结构,其结构是面向对象的而不是二维表,可以表示丰富的、有层级的数据结构,从而使得MongoDB能在生产环境中提供高读写的能力,吞吐量较于MySQL等SQL数据库大大增强。
(5) Redis数据库
Redis是典型的是非关系型数据库,且Redis是一款开源数据库,支持数据的持久化,可以将内存中的数据保存在磁盘中,重启的时候可以再次加载进行使用。Redis 不仅仅支持简单的keyvalue类型的数据,同时还提供list,set,zset,hash等数据结构的存储,同时还支持数据的备份,即master-slave 模式的数据备份。
2.7.2数据库容灾方式
数据库在信息系统架构当中承担业务数据存储和业务逻辑计算等工作,随着数据库应用场景的延伸和拓展,数据库在线数据的安全越发受到用户重视。数据库容灾则是保障数据库数据安全的重要手段之一。下面以Oracle数据库为例,简单分析一下几种常见的数据库容灾模式。
(1)基于存储层的容灾复制
基于存储层的容灾技术的复制机制是通过基于SAN的存储局域网进行复制,复制针对每个IO进行,复制的数据量比较大;系统可以实现数据的同步或异步两种方式的复制。对大数据量的系统来说有很大的优势(每天日志量在60G以上),但是对主机、操作系统、数据库版本等要求一致,且对网络环境的要求比较高。
(2)基于逻辑卷的容灾复制
基于逻辑卷的容灾技术的机制是通过基于TCP/IP的网络环境进行复制,由操作系统进程捕捉