アラートには、簡易とサマリの 2 種類があります。
どちらの種類のアラートも、Investigator ツリー内のアラート ノードの下に一緒に表示されます。
簡易アラートは、比較によって生成されたステータス情報を入力として取り込み、その情報をユーザ定義のしきい値と比較して、ステータスを出力します。 簡易アラートは以下の 4 つの状態のうちのいずれかを示します。
警告状態または危険状態に対して、どのアクションを開始するかを定義できます。 簡易アラートでは、危険アクション遅延と警告アクション遅延(SmartTrigger 機能)を使用して、指定のアクションを開始するタイミングを決定することができます。
簡易アラートは、Introscope のアラートの基本です。 簡易アラートは、アクションと通知を開始する機能を備えているほか、サマリ アラートに入力を提供する機能も備えています。 簡易アラートを作成するには、「簡易アラートの作成」を参照してください。
サンプル ダッシュボード上の各アラート インジケータは、Introscope の標準キー パフォーマンス インディケータの自動ヒューリスティックス モデリングに基づいています(「アプリケーションアイコンの概要」で説明しています)。 キー パフォーマンス インディケータにはすべて、対応するヒューリスティックス メトリックがあります。
ヒューリスティック メトリックの値は、1、2、または 3 です。
たとえば、アプリケーションの全体的な応答時間が通常は 600~1000 ミリ秒の間で変化し、現在の値が 835 ミリ秒である場合、応答時間のヒューリスティックス メトリックは値 1 とレポートされます。
たとえば、アプリケーションの CPU 使用率が通常は 30~60% で現在の値が 75% の場合、ヒューリスティックスの値は 2 になります。
たとえば、アプリケーションが通常はストールがまったくないか、たまに 1 つある場合に、アプリケーションのデータベースが突然要求への応答を停止した場合などです。 ストールの数は、10 などの比較的大きな数に増える可能性があります。 このような場合、アプリケーションのストール ヒューリスティックは、値 3 をレポートします。
固定のしきい値ではなく、ヒューリスティックス メトリックの観点からアラートを定義することで、キー パフォーマンス インジケータの正常値を判断する作業が APM の管理者から APM 自体に移ります。
アラートを定義するのに役立つテクニックは[過去 M 期間中の少なくとも N 期間]プロパティで、このプロパティは、アラートをトリガする危険ステータスを含むインスタンス数を定義します。
実運用環境では、キー パフォーマンス インディケータが、短期間、急上昇する可能性があります。 たとえば、CPU の使用率が15 秒間急上昇して、次の15 秒間で平常に戻ることが考えられます。
この種類の値の急上昇にアラートが Introscope で生成されることは望ましくありません。 Introscope に、最近の 8 つの期間の 8 つで条件が続く場合(各期間は 15 秒なので、最近 2 分間のうちの 2 分間)にアラートを生成するように設定することで、ランダムな急上昇に対してでなく、実際に問題のある条件にのみアラートが生成されます。
エージェント切断はクリティカルなイベントです。エージェントが Enterprise Manager から切断されると、そのエージェントでのデータの収集も監視も実行できなくなるためです。 これが発生した場合に通知をトリガする警戒体制を設定できます。
エージェント切断に対する警戒体制を設定する方法
このメトリックには、以下の値があります。
「切断」とは、エージェントが手動で切断されたことを意味します。
「マウント解除」とは、一定の時間(管理者の設定によって異なる)にわたって Enterprise Manager にデータがレポートされなかったためにエージェントが切断されたことを意味します。
しきい値は、アラートの感度に応じて設定します。
|
Copyright © 2013 CA.
All rights reserved.
|
|