S10508-V V5 IRF 堆叠、原主主控故障无法手工倒换,拔板完整方案
核心结论先讲清楚
IRF 堆叠环境 V5 版本,不支持slave switchover手工倒换命令,这是你敲 switchover 报错 / 无此命令的根本原因(手册明确:slave switchover仅独立单机生效,IRF 模式禁用)H3C;
当前现状:旧主控 = Master(故障、无法写配置),新插上的主控 = Standby(正常识别、双主控在位);
不建议直接热拔原 Master 故障主控:
官方规范:运行中严禁直接拔主用主控,即便备主控在位,故障主引擎拔取瞬间可能触发 IRF 震荡、堆叠分裂、业务板闪断、整机短暂断流;
故障主控存在写操作异常、Flash 损坏,直接带电拔出有概率损坏背板、网板、新备用主控;
安全操作分两种方案:低风险在线倒换(推荐,业务几乎无中断) / 整机下电拔出(零风险,需窗口期)
一、操作前置校验(必须先执行)
登录堆叠主设备执行,确认两块主控状态正常同步
plaintext
# 1. 查看单板状态,确认槽位、Master/Standby标记
display device
# 输出关键:一块Master(故障旧板)、一块Standby(新板,Normal无Fault)
# 2. 查看主备同步状态,必须stable才能操作
display system stable state
# 要求输出:System stable state: Stable
# 3. 核对两块主控软件版本完全一致
display version slot X
display version slot Y
# 版本不一致先同步:boot-loader update all
# 4. 查看IRF堆叠拓扑,堆叠链路全部Up无告警
display irf topology
display irf link
若stable state=Unstable,禁止任何拔板操作,等待 5 分钟同步稳定;
若新主控版本不一致,先同步固件,否则倒换后配置缺失、堆叠异常。
二、方案 1:在线安全切换(推荐,业务 0 中断,无需整机断电)
原理:重启故障 Master 主控,系统自动主备倒换,新 Standby 升为 Master;原故障板重启后自动变成 Standby,此时再离线拔出故障板。
完整执行命令
保存整机 IRF 全局配置(防止倒换丢配置)
plaintext
save
重启故障原 Master 主控(替换 X 为故障主控槽位号,如 slot0/slot1)
plaintext
reboot slot X force
等待 3~5 分钟,观察指示灯 + 查询状态
新主控 ACTIVE 灯常亮(新 Master);
旧故障主控重启后 ALM 红灯、ACTIVE 熄灭(Standby/Fault);
plaintext
display device
# 此时状态:新板Master,旧故障板Standby/Fault
display system stable state
# 再次确认Stable
对故障单板执行离线(V5 标准单板下线指令,释放背板总线)
plaintext
slot X offline
佩戴防静电手环,松开单板松不脱螺钉,平稳拔出故障主控
优势
全程整机不断电、IRF 堆叠不分裂、业务转发无中断;
先离线再拔板,规避背板信号冲击风险。
三、方案 2:整机下电拔出(零硬件风险,适合深夜维护窗口)
若业务极度敏感、担心重启故障主控出现不可预知震荡,直接整机断电操作:
保存配置 save
关闭该台 S10508-V 设备所有电源开关,整机完全下电
拔出故障主控板
上电开机,设备仅保留新主控单引擎运行,IRF 自动恢复堆叠拓扑
风险点
整机下电期间,该堆叠成员所有业务中断,四台 IRF 堆叠流量重新收敛,必须业务低谷操作。
四、绝对禁止的操作(现场踩坑点)
禁止不执行slot X offline直接带电拔原 Master 主控
故障引擎 Flash 损坏、写异常,热拔会造成背板总线异常,极端场景 IRF 分裂、整框业务板离线、网板故障。
不要尝试slave switchover
V5 IRF 堆叠模式下该命令不识别、直接报错,无任何作用。
不要只拔故障主控、不做版本同步
新旧主控版本不一致,重启倒换后会出现配置不同步、堆叠分裂、无法保存配置。
不要多台堆叠成员同时操作主控插拔,单台设备操作完成再处理下一台。
五、拔板后验证操作
拔出故障板后登录设备校验:
plaintext
# 1. 确认仅剩新主控,状态Master Normal
display device
# 2. 校验整机配置可正常写入,修复原“无法保存配置”问题
save
# 3. 校验IRF堆叠链路、拓扑完整无告警
display irf topology
display irf
# 4. 查看设备告警,无单板Fault、硬件告警
display alarm active
补充:故障根源说明
旧主控无法保存配置 = 主控 Flash/NVRAM 硬件损坏,即便临时倒换为主,仍存在配置丢失、反复重启隐患,拔出废弃是正确处理方式;新双主控在位时,依靠自动倒换机制替代手工 switchover 完成主备切换是 V5 IRF 唯一合规在线方案。
暂无评论
亲~登录后才可以操作哦!
确定你的邮箱还未认证,请认证邮箱或绑定手机后进行当前操作
举报
×
侵犯我的权益
×
侵犯了我企业的权益
×
抄袭了我的内容
×
原文链接或出处
诽谤我
×
对根叔社区有害的内容
×
不规范转载
×
举报说明
暂无评论