问题现象

我们经常可以在操作系统日志中看到一些可修正错误(Correctable Machine Check Errors),但是服务器实际使用中并无异常,且在IML(Integrated Management Log)日志中也没有相关报错。

告警信息

举例来说,此类可修正错误一般会纪录在以下操作系统日志中

  • Linux /dev/mcelog
  • Microsoft Windows WHEA Log
原因分析

服务器的CPU被设计成能够处理和纠正某些错误,这些类型的错误就是可修正错误。此类错误的发生,并不一定表明服务器的任何硬件有问题。某些操作系统会监控此类正错并可能生成一个日志来纪录此错误。

解决办法

这些可修正的错误的存在,如果仅仅在操作系统日志显示,是可以被忽略的。

建议与总结

HP ProLiant服务器的系统ROM是用于监测硬件错误并通过集成管理日志(IML)和其他手段(如健康LED)来报告的任何硬件问题。如果服务器在实际应用过程中无异常, 且在IML日志中也没有纪录相关硬件错误, 仅在操作系统日志中发现一些可修正的错误,此类错误建议客户可以忽略。

案例信息

案例类型:经验案例
案例号:201801310027
创建时间:2018年1月31日
更新时间:2018年1月31日
发布时间:2018/1/31 20:52:13
文章密级:游客可见
有效期:长期有效
发布者:刘灏 [l61368]
点击次数:220
评论平均得分:0
关键词:Correctable Machine Check Errors
产品线:x86塔式/机架式服务器
产品系列:HPE塔式/机架式服务器
产品版本:
故障类型:硬件问题

常用操作
收藏