MPIO:在HBA故障时确保冗余

时间:2021-05-20 12:39:14
在技术上,MPIO代表一条的岔路通道,通向多路径、组合软件特别是通向每个主机总线适配器(HBA),Device Specific Module (DSM),利用MPIOD的特性与Windows操作系统相结合。然而DSMs必须为特定的硬件所编写,而不具有普遍性,Microsoft设计的MPIO将使HBA的不可知性变为可能。这样,为了完成工作,其依靠硬件的其余部分和软件来工作。   这通常进行得不错,在Windows 存储环境中,MPIO是冗余和负责平衡的一个重要元素。但是当说到MPIO和HBA故障的时候,有一些事情你需要注意。   最明显的是你必须有至少两个与存储设备相连的HBA。一个双端口(dual-port)HBA 可提供两条数据通道,但是它仍然代表一个单独的故障点。   在存储区域网络(SAN)中,你需要确保设置在数据通道上的任何一个开关或路由器都具有充分的路径管理智能以处理由于HBA故障引起的中断。   理论上,如果数据通道发生中断,MPIO将会故障转移(fail over),然后当通道恢复时,在大约几秒钟的时间里故障恢复(fail back)。实际上,不总是那么简单。在群集环境里,你需要确定群集能够故障恢复以恢复数据通道,也能够在发生问题的时候故障转移。故障恢复(failback)与故障转移(failover)是互相分离的操作,两者不必对应进行。不能故障恢复(或者更糟,首先不能故障转移)的系统可能是由于HBA,开关或者其它组件配置错误,也可能是HBA自身存在问题。与你的硬件供应商联系以获得更多信息。((Microsoft讨论当HBA被切断和插回时将会发生什么,在群集上模拟故障转移和故障恢复)。   如果你还在运行Windows 2000,就会有另一个潜在的问题,如果发生故障,多路径软件可能会引起磁盘信号改变。这会导致系统瘫痪,因为找不到磁盘。   通常,如果出现涉及多路径的问题,你通过Microsoft处理不了。HBA的供应商编写MPIO驱动程序,不是Microsoft。Microsoft的态度是DSM和其它具体任务是通过硬件实现的,其相关的软件供应商不是Microsoft,应该找他们寻求帮助排除故障。