一台远行了6年的交换机自己重启,用标杆巡检说软件有个死循环。经过ai分析日志,在8866行发现了死循环记录:```==============display kernel deadloop20 verbose slot1 ===============--------------------- Deadloop record1 ---------------------Description : BUG: soft lockup - CPU#1 stuck for21s! [evHndl_5:78]Recorded at :2026-07-0220:23:52.834643Occurred at :2026-07-0220:23:52.834643Instruction address :0x00000000Thread : evHndl_5 (TID:78)Context : irq contextSlot :1Cpu :0VCPU ID :1```这是一个内核死循环记录,发生在2026-07-0220:23:52.834643,线程是evHndl_5 (TID:78),上下文是irq context。 想知道是软件问题还是硬件问题?
二层部署,做了irf,是irf集群的从机。
display version看重启原因 异常重启的话 估计要问下华三工程师
是异常重启(DeadLoopReboot),设备过保了,华三工程师要求在论坛里问。
BUG: soft lockup - CPU#1 stuck for21s! [evHndl_5:78]
Context : irq context
Thread : evHndl_5 事件处理线程,中断上下文卡死
ECC、voltage、temperature、chip error、reset reason
display reboot-info
看门狗复位(Watchdog reset)= 内核死循环触发看门狗强制重启,典型软件卡死特征。
根据你提供的内核日志,这台运行了6年的交换机重启,根本原因可以确定为软件层面的内核死循环(Kernel Deadloop)。
你的日志 BUG: soft lockup - CPU#1 stuck for 21s! [evHndl_5:78] 明确指向了软件问题。
BUG: soft lockup:这是Linux内核检测到的一个严重软件错误。它表示一个CPU核心被某个进程(这里是evHndl_5)占用了超过21秒,导致其他任务无法得到调度。H3C交换机也是基于Linux内核的,因此会出现相同的错误。
evHndl_5 线程:这个线程负责处理事件任务。搜索结果显示,evHndl 相关进程(如 evHndl_2)在CPU占用过高时,会导致设备丢包、延迟高等问题。这说明 evHndl 线程的异常是已知的软件问题。
DeadLoop reboot:H3C官方将此类重启原因明确归类为 DeadLoop reboot,即“内核死循环导致的重启”。
虽然日志指向了软件,但有两点需要考虑,因此不能完全排除硬件诱因:
设备老化:运行了6年的设备,其硬件(如内存、电容)可能存在老化或不稳定因素,可能诱发了软件层面的崩溃。
环境因素:供电不稳定、温度过高等环境问题也可能导致系统运行异常。
建议按以下顺序操作:
亲~登录后才可以操作哦!
确定你的邮箱还未认证,请认证邮箱或绑定手机后进行当前操作
举报
×
侵犯我的权益
×
侵犯了我企业的权益
×
抄袭了我的内容
×
原文链接或出处
诽谤我
×
对根叔社区有害的内容
×
不规范转载
×
举报说明
是异常重启(DeadLoopReboot),设备过保了,华三工程师要求在论坛里问。