揭秘运营商数据中心的物理层高可用机制(二)机柜级别高可用

时间:2023-02-05 15:54:54

之前一篇文章说了以下设备的高可用机制,包括交换机、服务器、防火墙等设备和连线的高可用,这篇文章主要是聊一聊如何规划机柜级别的高可用。

一、列头柜

列头柜即电源配电柜,一般列头柜为当前列机柜进行配电管理的设备。当列头柜出现故障的时候可能会导致整列机柜供电中断。

揭秘运营商数据中心的物理层高可用机制(二)机柜级别高可用

二、机柜级别的高可用

实现机柜级别的高可用非常简单,就是把设备分开放,避免鸡蛋放在同一个笼子里。

2.1 主机高可用

比如以下拓扑:

揭秘运营商数据中心的物理层高可用机制(二)机柜级别高可用

将同一个主机组设备放到不同的列中,当某一列机柜断电,虚拟机会HA到另一列的主机上。怎么合理的分布需要根据设备的数量、主机组内资源冗余度来确定,基本上设备分散越广越安全,但实施和运维难度也会越大。

但没有这么多机柜资源能使用时,至少要做到同列跨机柜,如下图:

揭秘运营商数据中心的物理层高可用机制(二)机柜级别高可用

2.2 存储高可用

当使用分布式存储时,参照主机摆放方式即可,但是一定要注意将分布式存储的管理节点(比如部署了ZK)跨机柜摆放。

当使用集中式存储时,如果只是单台存储,则不用考虑摆放的问题。

如果做了存储双活或者使用存储A/B面的情况下,需要跨机柜或跨列摆放。

存储双活就不用多说了,那什么是存储A/B面呢?存储A/B面即某个业务使用两套集中式存储,一半业务使用A存储,一般业务使用B存储,这种情况称为存储A/B面。

揭秘运营商数据中心的物理层高可用机制(二)机柜级别高可用

采用存储A/B面部署,可以防止单台存储故障导致某个业务完全受损。为啥不采用双活?双活贵啊~

2.3 网络设备高可用

网络设备高可用和存储高可用差不多,组成M-LAG或者堆叠的两台或多台交换机要保障有机柜级安全。

如下图:同一个主机组的主机连到不同的交换机组。

揭秘运营商数据中心的物理层高可用机制(二)机柜级别高可用

最后想说,高可用和成本是相对的,可用性越高,成本就越高,不同的项目采取不同的设计,没有完美的方案,只能因地制宜。

我是运维少年,欢迎关注我的同名公众号,谢谢~