适用于 CA6000 和 CA6300 设备
问题:重新启动设备时,SCSI“检测”或“挂起”错误类似于下面显示的内容:
Feb 3 04:59:20 smkong3 kernel: sd 1:0:0:0: SCSI error: return code = 0x08000002 Feb 3 04:59:20 smkong3 kernel: sdb: Current: sense key: Hardware Error Feb 3 04:59:20 smkong3 kernel: Add. Sense: Internal target failure Feb 3 04:59:20 smkong3 kernel: Feb 3 04:59:20 smkong3 kernel: Info fld=0x0 Feb 3 04:59:20 smkong3 kernel: end_request: I/O error, dev sdb, sector 34 Feb 3 04:59:20 smkong3 kernel: Device sdb1, XFS metadata write error block 0x0 in sdb1 Feb 3 05:00:21 smkong3 kernel: aacraid: Host adapter abort request (1,0,0,0) Feb 3 05:00:21 smkong3 last message repeated 255 times Feb 3 05:00:21 smkong3 kernel: aacraid: Host adapter reset request. SCSI hang ? Feb 3 05:01:21 smkong3 kernel: aacraid: SCSI bus appears hung Feb 3 05:01:41 smkong3 kernel: aacraid: Host adapter abort request (1,0,0,0)
这些错误表明发生了逻辑或物理数据损坏,但还没有被 RAID 控制器检测到和进行更正。
解决方案:SCSI 错误通常表明物理驱动器上累积的坏扇区已导致系统或数据阵列上出现数据损坏。 即使阵列状态为“最佳”,也要尝试修复需要修复的阵列或避免使用坏扇区。
启动设备时,请使用终端显示器来识别 SCSI“检测”或“挂起”错误。 这些错误可能会在设备正常运行期间间歇性地发生,但不会造成明显的损害,或者导致间歇性的 Linux 内核崩溃。 但是,如果 Linux 系统文件已经损坏,则设备可能无法启动,从而会反复引起同样的内核崩溃。
可以分两个阶段尝试恢复:
在恢复过程中,请确保使用磁盘实用工具来验证阵列中每个驱动器的磁盘介质,然后重建阵列。 请注意,验证每个驱动器可能需要一个多小时。
如果这两个步骤都不能消除 SCSI 错误或挂起错误,则可能无法将设备恢复为运行状态,除非重新安装 CentOS Linux 和 CA Multi-Port Monitor 软件或更换设备。 联系 CA 支持,以获取帮助。
|
版权所有 © 2014 CA Technologies。
保留所有权利。
|
|