案例11 Metro 1000V3R5设备备用通道上报HP_UNEQ告警
故障现象
某铁路局调度集中网管复用段环中A网元掉电之后,该复用段环上四个网元在备用通道VC4-3/VC4-4均上报B3_SD、HP_RDI、HP_REI、HP_UNEQ告警,无业务中断。
组网情况
调整前组网(物理连纤)如图1-6所示。
图 1-6
调整后组网(网管侧连纤)如图1-7所示。
图 1-7
原因分析
1.环路上某段光路衰耗过大引起B3_SD误码,对端站接收到B3误码引起HP_REI、HP_RDI告警;
2.A网元掉电重启后,复用段环协议不正常导致备用通道上报B3_SD等异常告警。
故障定位及处理过程
1.查询网元的历史告警、性能,发现A网元掉电之前没有异常告警,查询站与站之间的线路光功率值,光板收光均在正常范围内;
2.在A网元至D网元、D网元至C网元之间分别做一条2M测试业务,支路均上报TU_AIS告警;
3.检查复用段保护子网属性发现网元倒换状态均为穿通态,备用通道已使能,怀疑与复用段环协议有关;
4.通过网管ECC链路管理发现D网元物理连纤与网管连纤相反,保护子网中网管侧复用段东西向映射与实际光纤连接相反,分析是A网元掉电后复用段环协议混乱所致;
5.D网元光纤接反为何以前做的业务正常,分析现网业务发现环路上各网元只承载了一条CTC业务,并且各网元CTC业务东西向使用的都是第一个VC4的第一个VC12时隙,而CTC业务,没有业务方向之分即使接反也不影响使用,所以最初业务能通;
6.为保障业务正常运行及出现断纤情况业务能够正常倒换,需将D站5号板位,1、2号光板物理光纤对调,使物理连纤与网管连纤、复用段协议东西方向映射一致;
7.现场调整D网元物理连纤(见调整后组网);
8.在网管保护子网属性中停启四个网元复用段协议,查看四个网元的所有异常告警消除;
9.进行复用段环倒换测试,查看环路各站点业务正常;
10.网管侧手工备份网元数据库。
总结和建议
设备开局及维护中,注意检查网元的物理连纤与网管侧连纤是否一致,避免断纤时造成业务中断。