如何降低云服务器数据中心停电风险

时间:2021-04-03 00:42:15

     虽然公有云服务器部署在云端,但其基础架构仍然面临一定风险。例如,一场袭击弗吉尼亚州的大规模飓风导致Equinix数据中心设施停电,影响多家AWS客户的连接问题。与此同时,在没有电源的情况下运营内部IT基础架构的企业可能无法带来强大的功能。但是,公有云基础架构的客户可以通过多种方法来降低与影响公有云数据中心的停电相关的风险。

一、了解公有云服务器中断的风险

       分析显示,IT中断比云服务器的安全漏洞带来更大的风险。公有云数据中心受到多层复杂安全机制的保护,可防止安全侵权和数据泄露。停电频繁,可能使服务停机,造成客户数据无法访问。在某些情况下,数据会丢失并且无法恢复。

       因此,使用云服务器的商业公司应了解公有云数据中心停电的固有风险,以确定适当的风险缓解策略。风险可能包括飓风、地震、洪灾等自然事件的地理和区域威胁。企业还需要考虑由于IT服务中断而可能产生的损失的真实成本。这些可能包括由于服务中断导致的实际业务损失,对品牌忠诚度和声誉的影响,收入和商业机会的损失以及劳动力生产力的损失。

二、异地冗余和多云战略

       云计算允许企业通过在其IT基础架构策略中引入冗余来防止停电和停机的影响。云计算中的冗余遵循一种简单的方法:如果一个服务器实例发生故障或耗尽电量,则工作负载可能会转移到另一个服务器实例。如果整个数据中心受到停电的影响,则在异地的数据中心上复制的数据可以接管以提供必要的IT服务。冗余的优势克服了公有云数据中心停电的风险。多厂商云策略进一步补充了这一点,该策略涉及来自多个云提供商的服务配对。当停电影响主云服务器提供商时,来自辅助供应商的云服务器可以作为故障转移解决方案,以确保业务连续性。

三、测试业务连续性和灾难恢复

       如果企业在实际事件期间不准备执行计划,则在实际灾难期间,业务连续性和灾难恢复计划可能会产生截然不同的结果。应设计和测试有效的业务连续性和灾难恢复计划,以确定情况并解决灾难期间可能发生的限制。没有模拟测试,企业无法理解他们在灾难事件中可能面临的真实情况和限制。

四、与最终利益相关者沟通

       一旦停电并且企业执行其业务连续性和灾难恢复计划,重要的是通知最终用户影响范围和损害限制。与受影响用户的主动通信可能无法消除停电威胁,但它有助于降低急切等待服务正常运行时间的用户对客户信任和品牌忠诚度的影响。根据旨在降低停电风险的文档化灾难恢复计划,可能需要与业务利益相关者、内部专家和外部供应商进行沟通。

       公有云数据中心的停电往往在没有事先警告的情况下发生。重要的是不仅要了解风险,还要采取必要的措施来限制损失。企业应采用战略方法来采用公有云解决方案,并为导致未经宣布和不可预测的服务停机的威胁做好充分准备。