概要
APS(Automatic Protection Switching)是一种应用于基于VLAN以太网的线性保护机制。对一个已经配置了APS功能的工作实体上,会预留一个保护实体,当工作实体之间发生信号失效(SF)或者信号劣化(SD)后,会将相应的流量倒换到保护实体上,从而提供了一种快速简单的保护机制。
功能目的要求
APS应该用于基于点到点的VLAN SNC,负责在ETH流域内的两个ETH流点之间提供连接性,通过VID来标识基于点到点的ETH。
在一个单一工作实体上,100%被破坏的工作流量都应当得到保护。
保护倒换时间应不超过50ms。
应提供独立的以及组保护倒换功能。
应提供返回式和非返回式倒换。
应可以检测到近端与远端selector/bridge的不匹配。
应支持操作者配置如锁定、强制倒换和手工倒换等命令。
应支持信号失效和操作者请求之间有优先级的保护。
应提供可配置的“通用延迟功能”从而可以延迟保护倒换动作的开始。
APS网络模型
在点到点的ETH网络中,APS功能分为工作实体(working entity)和保护实体(protection entity)。在链路正常的情况下,流量在工作实体之间传输,当链路发生失效后将流量倒换到保护实体间的链路上。APS链路的首端(head end)担当桥接(Bridge)任务,负责选择将流量从哪条链路发出去;尾端(tail end)担当选择器(selector)任务,负责选择从哪条链路接收流量。
根据流量是否能一直在保护实体间传输,APS可以分为1+1和1:1两种模型,在1+1模型中流量在工作链路和保护链路上都有复制,分别传输;在1:1模型中,在链路正常的情况下保护链路不承载流量,只有当链路发生失效后才将流量切换到保护链路上。
根据流量方向又可分为单向(Unidirectional)和双向(Bidirectional)。下面详细描述APS中三种模型:
1.1+1单向:
在此模型中,保护域的首端将流量永久的在工作链路和保护链路上各复制一份发送。当尾端检测到链路失效后,selector会选择切换到保护链路进行流量的接收。每个方向都是独立的,因此尾端的selector只需工作在本地信息之上,不需要APS报文的交互来进行两端信息的协商。
如果工作链路发生单向故障,选择器将倒换至保护链路。
2.1+1双向:
在此模型中,和1+1单向模型一样,保护域的首端将流量永久的在工作链路和保护链路上各复制一份发送,但是当检测到链路失效后,保护域的两端都要进行状态的切换,即两端的bridge和selector都要切换到保护实体上去,因此此时就需要APS报文来进行信息协商。
3.1:1双向:
APS报文详解
APS报文实际上也是一种OAM报文,只是PDU为APS PUD。在OAM报文中,APS功能的OpCode为39。以下是APS PDU的详细格式:
1、Request/State:包含了一些本地命令的信息、信号失效、等待时间、是否返回等内容,每个内容都有不同的优先级,如果同时收到本端的命令和远端发来的APS报文,要按照优先级来执行。具体条目如下:
2、Protection Type:具体的APS保护形势,分为A、B、D、R四个字段:
A:表示是否有APS隧道。0为没有,1为有
B:表示是1+1还是1:1方式。0为1+1方式,1为1:1方式。
D:表示是单向还是双向。0为单向,1为双向。
R:表示是否返回,即当链路失效的情况恢复后,状态是否再次切换到工作实体上来。0为不返回,1为返回。
3、Requested Signal:
这个指示了本端要求对端进行保护切换。
在实际应用中, 对于APS报文中为SF请求,如果Requested Signal为Normal Traffic Signal,则说明本端通知远端的bridge要进行保护切换。
4、Bridged Signal:
指示了流量是否已经桥接到了保护链路上。对于1+1模型,这个标志位始终为Normal Traffic Signal,因为1+1模型中发送端始终是在工作链路和保护链路上各有业务复制。对于1:1模型,如果业务已经切换到了保护链路上,则将此位置为Normal Traffic Signal,否则为NULL。
5、Reserved:为保留位。
APS功能特征
1、 链路失效的检测:
在APS中,工作链路和保护链路的状态由OAM中的CCM来监测,此功能在Y.1731中定义。当两端检测到CCM超时之后,会触发链路失效的相关事件。
2、 返回和非返回倒换:
当链路失效后,正常流量会被倒换到保护链路上传输。当链路失效情况清除,工作链路恢复正常后,根据流量是否会再次被倒换到工作链路上分为返回式和非返回式。返回式会将流量再次倒换到工作链路上,非返回式不做此操作。
一般情况下,1+1模式为非返回式,1:1为返回式。因为在1+1模型中,首端是将流量复制两份分别在工作和保护链路上传输,尾端selector只是选择从哪接收,因此不管链路是否恢复,工作链路和保护链路上都有流量传输,因此不用返回。在1:1模型中,一般来说工作链路的状态会比保护链路更加优化,因此当工作链路恢复之后会倒换回去。
3、 保护倒换的触发:
当本地网管下发了相关命令(如强制倒换,人工倒换)后
在**的传输实体上宣布了SF,而在备用传输实体上没有宣布SF
收到的APS报文中要求倒换
4、 APS报文的发送和接收:
在状态发生改变时,如果没有配置Hold-off Timer,要立即发送APS报文,前三个报文要以3.3ms的间隔发送,与CCM的发送间隔一样;之后的报文以5s的间隔发送。如果一直没有收到带有有效信息的APS报文,则上一次收到的有效信息保持可用。如果再一次收到了带有有效信息的APS报文,则相关状态需要重新计算。
5、 对bridge的控制:
在1+1模型中,工作链路和保护链路上都要复制业务流量,因此业务始终一直桥接在工作实体和保护实体之上,发出去的APS报文中Bridged Signal也始终为Normal Traffic Signal。
在1:1模型中,有以下情况触发实体进行桥接:
在收到远端的APS报文中,请求类型为SF,并且Requested Signal为Normal Traffic Signal。此时表明远端已经检测到工作链路上的故障,并且远端的selector已经切换到保护链路上,正在通知本端进行bridge的切换。收到这种APS报文后,本端要将bridge切换到保护链路上,切换成功后发送出去的APS报文中Bridged Signal为Normal Traffic Signal,否则为NULL。
本端检测到工作链路故障。当CCM报文超时后,本端发现工作链路发生故障,因此将bridge切换到保护链路上,切换成功后将发送出去的APS报文的Bridged Signal置为Normal Traffic Signal。
人工命令控制强制倒换。
6、 对selector的控制:
将selector切换到保护链路上有以下触发形式:
本端工作实体通过CCM检测到工作链路失效,selector进行切换。
收到远端发来的APS报文中请求类型为SF,且Bridged Signal为Normal Traffic Signal。
人工命令强制倒换。
7、 两个定时器:
Hold-off Timer:
为了在不同层面或者分级保护域内协调保护倒换的定时,需要一个延迟定时器,允许服务器层保护倒换在客户层发生倒换之前有机会修复故障,或者允许上游保护域在下游域之前进行倒换。延迟定时器的时间为1s—10s,以100ms为步长。
当网元实体检测到链路故障之后,如果此时配置的Hold-off Timer不为0,则实体不会立即将链路失效的状态上报,而是先等待Hold-off时间。在Hold-off时间超时后,实体会检测之前出现故障的链路上是否还存在故障,如果有则SF或SD状态上报,如果没有则继续工作。
Wait-to-restore Timer:
在返回模式下,如果业务已经切换到保护链路,在工作链路恢复之后,要将业务重新切换到工作链路上。但是为了防止因为间歇性故障引起的频繁的保护倒换,在业务重新恢复到工作链路之前,应该等待一段时间,即WTR时间段,等WTR时间超时后,再切换回工作链路。WTR的范围为5min—12min,以1min为步长。
当一个实体检测到工作链路恢复后,要切换回工作链路之前,会向远端发送一个请求为WTR的APS报文,并且此APS报文中的Resquested Signal和Bridged Signal都为Normal Traffic Signal,通知远端等待WTR。当WTR时间超时后,本端将业务切换回工作链路,同时向远端发送请求为NR的APS报文,此时的APS报文中Requested Signal和Bridged Signal都为NULL。远端收到此报文后,知道对端已经恢复至工作链路,则远端自己也要进行切换,完成后向对端发送请求为NR的APS报文,此时Resquested和Bridged
Signal都为NULL,通知对端自己也完成了倒换。
8、 APS相关命令:
端到端命令及状态:
以下命令适用于本地和远端的整个保护组,因此当APS协议使能后,这些命令会发送到远端用来同步设定。在双向倒换中,这些命令同时影响到两端的bridge和selector。
保护锁定(Lockout of Protection):这个命令是为了防止从保护链路上选择业务流量,实际上就是禁止保护倒换。
强制倒换至保护侧(Force switch normal trafficsignal-to-protection):强制从保护链路选择业务流量。
人工倒换至保护侧(Manual switch normal traffic signal-to-protection):在工作链路和保护链路没有出现链路失效的情况下,强制从保护链路选择业务流量。
人工倒换至工作侧(Manual switch normal trafficsignal-to-working):在非返回模式中,在工作链路和保护链路都没有出现链路失效的情况下,强制从工作链路选择业务流量。
WTR时间信号(Wait-to-restore normal traffic signal):在返回模式中,当工作链路上的SF或SD信号清除后,需等待WTR时间后再切换回工作链路。待WTR超时后APS的请求状态为NR。
倒换练习(Exercise signal):进行APS报文的接收和发送练习,看APS功能是否正常,但是相关状态不通知bridge和selector。
非返回模式信号(Do-not-revert normal trafficsignal):在设定了非返回模式后,倒换后即使工作链路恢复正常,也不会重新倒换至工作链路。
清除(Clear):清除近端的LO,强制倒换,人工倒换,WTR和倒换练习设定。
本地命令:
以下命令只用于本地的APS保护组,即使使能了APS协议,并不会通知给远端。
冻结(Freeze):冻结本地保护组的状态。在清除冻结之前,所有本地命令都无效,而且忽略所有的状态变换及收到的APS报文。
清除冻结(Clear freeze):清除冻结状态
从保护组锁定信号(Lockout normal traffic signal fromprotection):阻止从保护实体选择业务流量。对于业务流量,SF或SD信号会被忽略。在双向倒换中,远端发来的桥接信号还是会被接收以防止协议失效。