铁路通信维护案例集
上QQ阅读APP看书,第一时间看更新

案例71 广播风暴引起以太网业务中断

故障现象

1.某铁路局4套OSN 3500采用2.5GMSP环形组网,NE1为中心站点,在2.5GMSP环网内配置两个622M的RPR环,其中RPR1环中承载的业务有CCTV、AFC1、广播、电源网管,RPR2环承载的业务为PIS、AFC2、无线网管、办公网;

2.维护人员申告环网中的以太网业务全部中断,而2M电路正常运行。

组网情况

组网如图1-47所示。

图 1-47

原因分析

1.中心站点NE1网元的以太网单板故障,造成网络中的以太网业务的上行故障,导致业务全部中断;

2.环网中某站点的以太网单板或业务产生网络风暴,造成通道堵塞,导致业务全部中断。

故障定位及处理过程

1.检查中心站点NE1的以太网单板状态,发现没有异常告警,单板运行正常;

2.检查各个站点以太网单板的RMON性能,发现数据流量较大,尤其是广播包的流量特别大,初步判定为网络中发生了广播风暴导致业务中断;

3.现场维护人员按系统逐个关闭传输侧以太网单板上外部端口,当关闭AFC系统传输侧外部端口时业务恢复正常;

4.通知AFC人员去检查设备情况,AFC系统在两个RPR环上各有一个传输通道,作为主备用,两个通道是通过网线接到同一个交换机上的,在端口上启用生成树协议,AFC人员通过检查发现在业务中断之前NE2站点的AFC交换机发生掉电,导致交换机上的生成树协议数据丢失,引起网络风暴,导致了本次故障的产生。

总结和建议

1.在配置有以太网电路的网络中,要防止出现以太网成环;

2.尽量在业务规划的时候就提前考虑到,最后从硬件上防止以太网成环情况的出现,从根本上杜绝此类故障的产生。