《H3C交换机IRF故障场景下应急操作指南新华三技术有限公司.docx》由会员分享,可在线阅读,更多相关《H3C交换机IRF故障场景下应急操作指南新华三技术有限公司.docx(4页珍藏版)》请在优知文库上搜索。
1、H3C交换机IRF故障场景下应急操作指南HBC新华三技术有限公司所有侵权必究Allrightsreserved2020-07-15一、应急方案处理1、 设备可登陆:(I)通过命令displayirf看设备堆叠是否分裂;正常情况下IRF状态如下:=displayirf=MemberIDSlotRolePriorityCPU-MacDescription10Standby3200e0-fc0f-8c0111Standby3200e0-fc0f-8c02*+30Master1000e0-fc0f-8c3131Standby1000e0-fc0f-8c32注:正常情况下IRF只有一个MaSter,其余
2、均为Standby:如果IRF分裂,则此处只会出现一个MaSter(或者看MemberlD是否是2个,如果变成1个就证明设备已经分裂了)(2)若设备未分裂,通过displaylogbufferreverse查看下设备是否有异常日志,如果有,建议将异常成员设备的端口利用POrt-range进行ShUtdoWn,可通过脚本刷下,观察业务是否恢复。如果没有,建议优先将备框端口ShUtdoWn观察,若未恢复,建议将备框物理端口开启,将主框物理端口ShUtdoWn观察业务恢复情况。(3)若业务恢夏,收集故障设备诊断信息及IOgfiIeLOgfiIe信息收集:logfilesaveThecontentsi
3、nthelogfilebufferhavebeensavedtothefilesinflash:/logfile.dirDirectoryofflash:0-rw-2570Sep22201719:35:13l.ak29drw-Nov19201714:36:21diagfile29drw-Nov19201714:36:21logfile可通过ftp方式导出。诊断信息(diagnostic-information)保存到设备存储,ftp导出到设备H3Cdisdiagnostic-informationSaveordisplaydiagnosticinformation(Y=save,N=displ
4、ay)?(YN:yPleaseinputthefilename(*.diag)cfa:/:Diagnosticinformationisoutputtingtocfa:/.PleasewaitSavesuccessfully.除以上信息外,如果是某个设备重启了,收集下如下信息:viewvarlogviewvarlog然后把flash上的和发回来。dissysteminternalIipctopologylinkdissysteminternalIipctopologyhistorydisplayrebootlast-timexdisplayrebootinterruptxview/proc/s
5、econdary_log_bufslotXdisplaykernelexceptiondisplaykernelrebootdisplaykerneldeadloopviewprocinterruptsslotx(设备运行过程反复多次收集,设备已经重启收集次即可)locallogbufferslot1displaysize(306090直至完全显示)from-highmemory(4)立即联系二线确认故障原因;(5)如果IRF已经分裂,且业务已经全部中断,查看主备框是否mad检测已经生效,如果生效,则将未生效设备端口进行ShUIdOWn,然后在另外一个机框上执行“madrestore,命令快速
6、恢复业务。如果MAD未生效,建议通过displaylogbufferreverse查看下设备是否有异常日志,如果有,建议将异常成员设备的端口利用POrt-range进行ShUIdoWr1,可通过脚本刷下,观察业务是否恢复。如果没有,建议优先将备框端口ShUIdoWn观察,若未恢复,建议将备框物理端口开启,将主框物理端口ShUIdOwn观察业务恢复情况。(6)若如上操作业务均未恢复,对框式设备按主控resel键重启设备,对于盒式设备,建议下电重启设备。2、 设备不可登陆:(1)携带串口线进入机房查看设备情况。(2)观察交换机设备是否有指示灯红灯的情况,如果有红灯闪烁,且插入ConSle线发现设备并未重启,此时建议通过reboot重启设备恢复,如果consle没有反应,建议掉电重启该设备恢复业务。如果是框式设备,有主控亮红灯,插入CorlSle看是否有重启输出,如果没有异常输入,建议通过面板的reset键进行恢复,正常情况下主控板卡指示灯及reset键位置如下图:S125X设备面板如下:S105系列面板指示灯如下:(3)收集诊断信息信息及IOgfiIe(收集方法如上)(4)立即联系二线紧急处理。3、如果以上方法均不行,为保证恢复业务,可以将设备下电,整机重启恢复业务;