このセクションには、以下のトピックが含まれています。
以下の設定を使用して、イベント パフォーマンスの検証とベンチマークが実行されました。
注: パフォーマンスを最適化するには、同じメトリック ファミリに対するイベント ルールを含む監視プロファイルの数を最小にします。 たとえば、1 つの監視プロファイルに[インターフェース]メトリック ファミリに対する 10 個のルールが含まれる場合は、10 個の監視プロファイルに[インターフェース]メトリック ファミリに対する 1 個のルールが含まれる場合よりも、パフォーマンスは向上します。いずれも同一のデバイス セットに適用されることを前提とします。
処理するイベントの数が多すぎるかどうかを判断するには、Data Aggregator 内のいくつかの重要業績評価指標(KPI)を監視する必要があります。 Data Aggregator でのイベント処理は、バッチ形式で実行されます。たとえば、大きなアイテム グループに対して、イベントは一度に評価および生成されます。 このため、Data Aggregator システムの健全性を評価するために、Data Aggregator システムの自己監視メカニズムを通じて追跡されたさまざまなメトリックが使用されました。 これらの重要なメトリックを表示するには、カスタムの[IM デバイス マルチトレンド]ビューをダッシュボードに追加します。 [Data Aggregator イベント計算時間]メトリック ファミリから以下のメトリックを使用して、ダッシュボードを編集します。
多数のイベントが連続して発生またはクリアされると、イベント マネージャ データベースに影響を与える可能性があります。
これらの 2 つのメトリックの合計が、5 分のポーリング サイクルで 900 イベントを超えると、中規模システムで推奨されている 1 秒あたり 2 ~ 3 イベントという生成レートを超過します。 イベントの生成/クリアは、5 分のポーリング サイクルで 900 イベントを大幅に超過しても許容されます。
テスト環境では、先に説明したように、5 分のポーリング サイクルで評価数が 15 万を超えるとシステムに問題が発生する可能性があることが分かりました。
これらのメトリックすべての時間変動を監視することで、ご使用のシステムのイベント パフォーマンスが正常かどうかを判断できます。 さらに、Data Aggregator システム上の Karaf ログにデータベース エラーやその他のエラーが含まれる場合、システムの負荷を示している可能性があります。 一般的に、これらの自己監視メトリックは安定した値である必要があります。 ただし、夜間(デフォルトでは UTC の午前 2 時から 4 時の間)には、一部のデータベース ジョブが集中的に実行されて、自己監視メトリックの値が変動する場合があります。 メトリックが安定状態に戻れば、システムは健全な状態にあると判断できます(ただし、システムがビジーである時間帯には、イベントが遅延する可能性があります)。
ルールを変更する際は、あらかじめイベント処理を少しずつ有効にして、システムの健全性を判断することをお勧めします。 また、各変更の後には、システムの健全性を 24 時間監視することをお勧めします。イベント処理が昼間は安定しているように見えても、夜間に実行される処理に影響を受ける可能性があるためです。
しきい値を超えた場合は、以下の手順に従って対処します。
|
Copyright © 2014 CA Technologies.
All rights reserved.
|
|