前のトピック: サーバ障害

次のトピック: サーバ フラッピング


概要

CA AppLogic は、1 つ以上の物理サーバが失われた状態から自動的に復旧できます。 CA AppLogic グリッドを構成する物理サーバでは、以下のいずれかの理由で障害が発生する可能性があります。

サーバ障害に対する耐性を得るため、CA AppLogic はグリッドのサーバ間ですべてのボリュームをミラーリングします(デフォルトでは、すべてのボリュームが 2 箇所でミラーリングされます)。 ボリュームをミラーリングすることにより、物理サーバの障害が発生してもアプライアンスの操作を続行できます(当然ながら、障害が発生したサーバ上でアプライアンスが実行されている場合は除きます)。

CA AppLogic は、グリッド コントローラとのネットワーク接続が失われたことによって障害が発生したサーバを(通常はサーバ障害の発生後 3 分以内に)検出します。 障害が検出されると、そのサーバ上で実行されていたアプライアンスをグリッド内の他のサーバ上で実行するようにスケジュールが自動的に設定されます。 アプライアンスを再起動できるのは、グリッド内に十分な利用可能リソースがある場合のみです。 サーバ障害の発生時にアプライアンスを再起動するための十分な利用可能リソースがない場合は、グリッド ダッシュボードにアラートが表示されます。 グリッド ダッシュボードに以下のアラート表示された場合は、グリッドにサーバを追加するため、サービス プロバイダにお問い合わせください。

n 個のサーバ [サーバのリスト] で実行中のコンポーネントを再起動するための十分な利用可能リソースがありません。 

サーバ障害とアプライアンスの自動的な再起動が発生した場合は、グリッド ダッシュボードに復旧アラートがポストされます。 たとえば、グリッド内の srv3 に障害が発生すると、以下のアラートが表示されます(srv3 上でアプライアンスが実行されており、アプライアンスを再起動するための十分な利用可能リソースがグリッドにあるとします)。

サーバ障害の後でアプライアンスが正常に再起動されると、上記の 2 つのアラートは破棄され、以下のアラートがグリッド ダッシュボードにポストされます。

1 つ以上のアプライアンスを再起動できない場合は、障害が発生したアプライアンスごとに以下のいずれかのアラートがグリッド ダッシュボードにポストされます。 アプライアンスが開始されなかった詳しい理由については、list log コマンドを使用してコントローラ ログを参照してください。