上一主题: 恢复无效驱动器 - CA6300下一主题: 评估和恢复 XFS 文件系统损坏


评估和恢复 SCSI 磁盘损坏

适用于 CA6000 和 CA6300 设备

问题:重新启动设备时,SCSI“检测”或“挂起”错误类似于下面显示的内容:

Feb  3 04:59:20 smkong3 kernel: sd 1:0:0:0: SCSI error: return code = 0x08000002
Feb  3 04:59:20 smkong3 kernel: sdb: Current: sense key: Hardware Error
Feb  3 04:59:20 smkong3 kernel:     Add. Sense: Internal target failure
Feb  3 04:59:20 smkong3 kernel:
Feb  3 04:59:20 smkong3 kernel: Info fld=0x0
Feb  3 04:59:20 smkong3 kernel: end_request: I/O error, dev sdb, sector 34
Feb  3 04:59:20 smkong3 kernel: Device sdb1, XFS metadata write error block 0x0 in sdb1
Feb  3 05:00:21 smkong3 kernel: aacraid: Host adapter abort request (1,0,0,0)
Feb  3 05:00:21 smkong3 last message repeated 255 times
Feb  3 05:00:21 smkong3 kernel: aacraid: Host adapter reset request. SCSI hang ?
Feb  3 05:01:21 smkong3 kernel: aacraid: SCSI bus appears hung
Feb  3 05:01:41 smkong3 kernel: aacraid: Host adapter abort request (1,0,0,0)

这些错误表明发生了逻辑或物理数据损坏,但还没有被 RAID 控制器检测到和进行更正。

解决方案:SCSI 错误通常表明物理驱动器上累积的坏扇区已导致系统或数据阵列上出现数据损坏。 即使阵列状态为“最佳”,也要尝试修复需要修复的阵列或避免使用坏扇区。

启动设备时,请使用终端显示器来识别 SCSI“检测”或“挂起”错误。 这些错误可能会在设备正常运行期间间歇性地发生,但不会造成明显的损害,或者导致间歇性的 Linux 内核崩溃。 但是,如果 Linux 系统文件已经损坏,则设备可能无法启动,从而会反复引起同样的内核崩溃。

可以分两个阶段尝试恢复:

  1. 重建阵列
  2. 如果重建不成功或 SCSI 错误没有解决,请尝试从失败条带恢复

    在恢复过程中,请确保使用磁盘实用工具来验证阵列中每个驱动器的磁盘介质,然后重建阵列。 请注意,验证每个驱动器可能需要一个多小时。

如果这两个步骤都不能消除 SCSI 错误或挂起错误,则可能无法将设备恢复为运行状态,除非重新安装 CentOS Linux 和 CA Multi-Port Monitor 软件或更换设备。 联系 CA 支持,以获取帮助。

详细信息:

关闭或重新启动设备

恢复无效驱动器 - CA6300