CA6000 および CA6300 のアプライアンスに該当
問題: アプライアンスの再起動時、カーネル パニックの前に以下のような XFS コード コール スタックが表示されます。
RIP [<ffffffff883cf607>] :xfs:xfs_error_report+0xf/0x58 RSP <ffff81028c817c28> CR2: 0000000000000118 <0> Kernel panic – not syncing – Fatal exception
解決策: 破損した XFS ファイル システムをできるだけ早く復旧することをお勧めします。 通常、XFS ファイル システムが破損すると、上記に似た Linux カーネル パニックおよびシステム停止が発生します。
CA Multi-Port Monitor アプライアンスは、以下の 2 つのパーティションで高パフォーマンスの Linux XFS ファイル システムを使用しています。
/nqxfs 上にマウントされた /dev/sdb1 は Vertica メトリック データベースをホストします。
/data 上にマウントされた /dev/sdb2 は CA Multi-Port Monitor パケット キャプチャ ストレージをホストします。
/nqxfs 上にマウントされた /dev/sda4 は Vertica メトリック データベースをホストします。
/data 上にマウントされた /dev/sdb1 は CA Multi-Port Monitor パケット キャプチャ ストレージをホストします。
XFS ファイル システムが破損するのは、通常、アプライアンスで停電またはハードウェア ハングアップが発生した場合です。
Linux カーネル パニックはほとんどの場合、アプライアンスが再起動した直後、Vertica メトリック データベースが開始されたときに /nqxfs パーティションで発生します。 以下の例では、端末画面に XFS コール スタックおよびカーネル パニックが表示されています。 影響を受けたパーティションが表示されない可能性はありますが、両方の XFS パーティション(/nqxfs および /data)で安全に xfs_repair を実行して、XFS ファイル システムの破損をすべて修復することができます。
XFS ファイル システムを修復して、そのファイル システム上の破損を解決します。 破損が /nqfxs パーティション(Vertica メトリック データベースが存在する場所)で発生した場合は、Vertica メトリック データベースを再作成します。
CA6000 および CA6300 のアプライアンスに該当
影響を受けたパーティション上で xfs_repair コマンドを使用して、破損した XFS ファイル システムを修復します。 XFS ファイル システムの破損を修復した後に必要な操作は以下のとおりです。
XFS 修復の完了までの予想時間: 30 ~ 60 分
次の手順に従ってください:

注: シングル ユーザ モードでは、アプライアンスは端末画面からのみアクセスできます。
マウント解除して、そのブロック デバイスに xfs_repair を実行します。
umount /nqxfs xfs_repair /dev/sdb1
マウント解除して、そのブロック デバイスに xfs_repair を実行します。
umount /data xfs_repair /dev/sdb2
マウント解除して、そのブロック デバイスに xfs_repair を実行します。
umount /nqxfs xfs_repair /dev/sda4
マウント解除して、そのブロック デバイスに xfs_repair を実行します。
umount /data xfs_repair /dev/sdb1
Phase 1 - find and verify superblock...
Phase 2 - zero log...
- scan file system freespace and inode maps...
- found root inode chunk
Phase 3 - for each AG...
- scan and clear agi unlinked lists...
- process known inodes and perform inode discovery...
- agno = 0
- agno = 1
...
- process newly discovered inodes...
Phase 4 - check for duplicate blocks...
- setting up duplicate extent list...
- clear lost+found (if it exists) ...
- clearing existing “lost+found” inode
- deleting existing “lost+found” entry
- check for inodes claiming duplicate blocks...
- agno = 0
imap claims in-use inode 242000 is free, correcting imap
- agno = 1
- agno = 2
...
Phase 5 - rebuild AG headers and trees...
- reset superblock counters...
Phase 6 - check inode connectivity...
- ensuring existence of lost+found directory
- traversing file system starting at / ...
- traversal finished ...
- traversing all unattached subtrees ...
- traversals finished ...
- moving disconnected inodes to lost+found ...
disconnected inode 242000, moving to lost+found
Phase 7 - verify and correct link counts...
Done
アプライアンスを再起動すると、パーティションが正常であれば Linux カーネル パニックをトリガしなくなります。
|
Copyright © 2014 CA Technologies.
All rights reserved.
|
|