您好,根据您描述的情况,问题核心在于新硬盘虽然被识别,但并未被自动或手动地加入到原有的RAID 1阵列中开始重建(Rebuild)。将硬盘设置为“全局热备”通常不会自动触发对特定降级阵列的重建。
以下是详细的解决步骤和建议:
这是最直接的方法。请重新进入CTRL+R的RAID卡WebBIOS或管理界面。
MSI 9361-8I RAID1 SSD 更换后两大故障完整分析 + 分步修复
一、两个现象分开拆解根因
现象 1:热插拔 SSD 不认,必须冷重启才能识别
背板 / RAID 卡热插拔功能未完整开启
H3C 服务器搭配 9361-8I,默认 BIOS/UEFI 内 SAS/SATA 热插拔开关未全开;热插拔后背板无法完成 PCIe 信号重训练,RAID 卡不会枚举新盘,断电上电才能完整扫描所有槽位。
SSD 介质兼容性问题
原装 OEM SSD 与第三方零售 SSD 的 SAS/NVMe 握手时序差异,热插拔上电时序不匹配,冷启动整机上电时序完整,才能正常识别。
RAID 卡固件老旧
老版本 MegaRAID 固件存在 SSD 热插拔枚举 BUG,冷启动扫描逻辑正常,热插拔事件捕获失效。
现象 2:冷启动识别新盘 Unconfigured Good,设全局热备依然不自动重建(核心故障)
核心 4 个根本原因(按概率排序)
旧故障盘未彻底移除,阵列标记仍残留故障位,自动重建逻辑锁死
原告警硬盘只是拔出,但 RAID 卡缓存 / 阵列配置里仍标记该槽位为 Failed;控制器判定「故障盘还存在」,不会使用热备盘顶替。
新盘存在 Foreign 外来配置(最常见)
第三方 SSD 之前在其他阵列使用过,盘内残留 MegaRAID 阵列元数据,控制器判定为外来盘,即便设全局热备,也拒绝自动接管重建。
RAID 卡自动重建开关 Auto Rebuild 被关闭
出厂或之前调试关闭了自动重建,仅手动添加盘才能同步。
全局热备机制不适合当前场景
RAID1 降级时,最优方案不是全局热备,而是直接把空闲盘加入现有阵列做成员盘;全局热备仅用于后续再次坏盘,不会主动顶替当前已降级阵列。
二、分步标准修复流程(全程 Ctrl+R 界面操作,不丢数据)
前置准备
确认:原故障 SSD 已完全拔出,服务器断电重新上电,新盘状态为 Unconfigured Good,RAID1 状态 Degraded。
步骤 1:清除新盘外来配置 Foreign(必做)
Ctrl+R 进入阵列界面,切换到 PD Mgmt(物理磁盘管理)
选中新 SSD,按 F2,查看是否有 Clear Foreign Configuration
执行清除,确认操作;清除后盘保持 Unconfigured Good 状态
关键:有外来配置的硬盘,永远不会自动重建,这是 9361 最典型卡点。
步骤 2:两种方式触发重建(推荐方案 A,稳定最快)
方案 A:直接添加硬盘到 RAID1 阵列(优先,无需热备)
返回 VD Mgmt,选中 Degraded 的 RAID1 虚拟磁盘,按 F2
选择 Add Drive,选中这颗 Unconfigured Good 新 SSD
确认后直接启动 Rebuild 重建,硬盘指示灯持续闪烁代表同步中
界面可查看重建进度,完成后阵列状态变为 Optimal
方案 B:专用热备 Dedicated HS(备选,不推荐全局热备 Global HS)
全局热备是备用兜底盘,不会主动修复当前已降级阵列;需要绑定给这个 RAID1 做专用热备:
PD Mgmt 选中新盘 F2 → Make Dedicated HS,选中当前 RAID1 虚拟盘
确认后控制器立刻触发重建;不要再设置全局热备,二者冲突。
步骤 3:检查自动重建全局开关(重建仍不启动时执行)
Ctrl+R 主界面按 Ctrl+P 进入控制器高级设置
找到 Auto Rebuild 选项,设置为 Enabled
重建速度 Rebuild Rate 建议设 30~50,兼顾业务与同步速度。
步骤 4:修复「热插拔不认盘」问题(长期根治)
服务器开机按 Del/F2 进 BIOS/UEFI
Storage 选项内开启:SAS Hot Plug、SATA Hot Plug、PCIe Hot Plug 全部打开
升级 RAID 卡 9361-8I 固件至 H3C 官网最新适配版本,修复 SSD 热插拔枚举 BUG
更换同规格托架,确认托架卡扣完全扣紧,避免接触不良。
三、命令行备用方案(系统内 storcli 工具操作)
若服务器已进系统,可通过 storcli64 一键处理,无需重启进 Ctrl+R:
bash
运行
# 1. 查看所有物理盘状态
storcli64 /c0 show all
# 2. 清除0号控制器外来配置
storcli64 /c0 clear foreign config
# 3. 将槽位2硬盘加入0号RAID1阵列(槽位按实际替换)
storcli64 /c0/v0 add drives [eall,s2]
# 4. 查看重建进度
storcli64 /c0/v0 show rebuild
四、关键避坑要点
不要只设置全局热备
全局热备 = 后续再坏盘才顶上;当前阵列已经降级,必须手动 Add Drive 加入阵列,或配置专用热备才会同步。
容量必须≥原盘
你已经同容量满足条件,若新盘更小会直接无法加入阵列。
重建期间禁止断电、不要高 IO 压测业务,避免重建中断。
重建完成后建议运行一次完整校验 Verify,确认数据无差异。
五、故障完整复盘
热插拔识别失败:BIOS 热插拔未开启 + RAID 卡固件老旧 + 第三方 SSD 握手时序不兼容;
设全局热备不重建:新盘存在 Foreign 外来配置,且全局热备不会主动修复已降级阵列;
标准根治操作:清除外来配置 → 直接 Add Drive 加入 RAID1 阵列启动重建,同步开启 BIOS 热插拔、升级 RAID 固件解决插拔识别问题。
暂无评论
根据你的描述,问题核心在于新硬盘虽然被识别,但并未被自动或手动地加入到原有的RAID 1阵列中开始重建(Rebuild)。将硬盘设置为“全局热备”通常不会自动触发对特定降级阵列的重建。
以下是详细的解决步骤和建议:
兼容性问题:虽然你购买了同容量的固态硬盘,但9361-8i RAID卡对非H3C认证或特定型号的硬盘可能存在兼容性限制。这可能导致RAID卡能识别硬盘为“Good”,但拒绝将其用于重建。
操作流程问题:RAID 1阵列降级后,需要明确地将新硬盘指定为故障硬盘的替换盘,并手动启动重建过程,而不仅仅是设置为热备盘。
请重新进入 Ctrl+R 的RAID卡WebBIOS或管理界面。
进入物理磁盘管理:找到新安装的那块状态为“Good”的硬盘。
取消全局热备设置:如果已设为全局热备,请先将其移除热备状态(可能需要选择“Make Unconfigured Good”或类似选项),使其恢复为未配置的“Ready”状态。
执行重建操作:
如果步骤一无法执行,或新硬盘状态显示为“Foreign”(外来)或“Unconfigured Bad”,可能需要先导入外部配置。
进入RAID卡配置界面:重启服务器,按 Ctrl+R 进入。
找到Foreign Configuration选项:在RAID卡配置界面中,找到“Foreign Configuration”选项。
导入外部配置:选择“Import Foreign Configuration(导入外部配置)”。注意: 确认操作后,RAID控制器会自动合并原有RAID配置,恢复逻辑盘,数据不会丢失。
如果新加硬盘后无法在BIOS中配置阵列,可能是因为阵列卡模式设置为JBOD,而不是RAID。
进入阵列卡配置界面:重启服务器,按 Ctrl+R 进入。
检查Controller Mode:在主菜单中,选择“Controller Configuration”,然后查看“Controller Mode”。
再次尝试步骤一:重启后,再次进入RAID卡配置界面,尝试手动启动重建。
暂无评论
亲~登录后才可以操作哦!
确定你的邮箱还未认证,请认证邮箱或绑定手机后进行当前操作
举报
×
侵犯我的权益
×
侵犯了我企业的权益
×
抄袭了我的内容
×
原文链接或出处
诽谤我
×
对根叔社区有害的内容
×
不规范转载
×
举报说明
暂无评论