交换机故障处理来源:东升耘智 时间:2019-12-24 14:06
一、故障现象网管平台显示交换机HLDJ7609处于离线状态,且无法PING通管理地址,现场管理人员查看链路线路正常、设备电源供电正常,设备板卡上的主控板告警灯不断闪烁亮红灯。初步判断该设备主控板故障,导致网络通信故障。

二、处理过程
1、运维人员赶往现场处理故障,带上备品备件及测试工具,现场通过console口登录7609设备,发现设备系统无法正常加载,通过运行命令:confreg 0x2102。将配置寄存器的值初始为2102,并reload重启系统,引导系统从ROM启动。
2、拔下主控板更换BIOS里面的电池;
3、重启设备,设备正常启动并运行正常,网管平台中设备状态恢复正常,网络通信恢复。
三、故障原因
通过分析网管告警产生原因,故障原因可以分为以下两点:
1.主控板板卡故障 ;
2. BIOS里面的电池耗尽,无法正常加载配置文件。
四、整改建议
1. 重要网络设备,采用双主控冗余架构,避免因主控故障导致的网络中断;
2. 日常维护中修改配置后,及时运行write命令保存配置,保证设备running-config与 startup-config配置一致,以免设备掉电或故障后导致更新的配置丢失;
3. 加强对机房设备的巡视,注意设备运行状态的监控及各种告警指示灯的变化;
4. 对设备运行年限做好统计,针对可能出现问题的设备进行重点巡视;
5. 凡事需要做到事前预防,事中应对,事后总结。