数据中心的安全环境是由一个真实的环境和虚拟的环境构成。
真实的环境主要是指硬件设施和相关物理配置的资源等;虚拟的环境主要是指软件设施的安全性。
数据中心环境构成示意图
在数据中心机房里,有很多我们不可避免会遇到的单点故障,它可能属于真实环境下,如电源、制冷等;也可能是虚拟环境下,如网络通信、软件系统等,为了保障数据中心的安全,这些单点故障都是值得被关注的焦点。
什么是单点故障?
单点故障,是指引发系统失效的单项故障,会给整个系统带来灾难性的破坏。
和单个故障是看似相似实为不同的两个词语。单个故障则是不会引发整个系统失效的单项故障。打个比方,一部正在放映的电影,如果出现放映机短路而导致观影结束,放映机短路就是单点故障。同样是放映的电影,如果出现*空调短路,但并不会影响整个电影的继续放映,只是会影响观影感受而已,这个故障就是单个故障。
如何避免单点故障?
在数据中心机房中,因各种原因可能会出现一些故障,但要尽力控制在单个故障范围,避免由单个故障升级为单点故障。避免单点故障可以用以下五个招式:
第一招:抓关键
第二招:留备份
第三招:存余量
第四招:抓推演
第五招:备预案
案例:双电源加发电机供电方案示意图
对于机房的单点故障问题,其实不必太过忧虑。只要参照上面提供的五种方式,在故障发生前学会如何降低风险,在故障发生后积极的寻求减小损失的措施,就算遇到问题了,总能解决。