前のトピック: ケース スタディ 2: システム可用性 2次のトピック: ケース スタディ 4: ヘルプデスク パフォーマンス


ケース スタディ 3: システム応答時間

以下のケース スタディでは、応答時間メトリックを説明します。 1 つの契約を複数の方法でモデル化できます。それぞれの方法に独自の利点があります。

以下の例では、さまざまなモデル化方法を確認します。

示唆されたモデリング ソリューション A

最大値

CNP システムのトランザクション応答時間

1 月当たり 750 ミリ秒を超えないこと

メトリック名

最長トランザクション応答時間

ターゲット

750

トラッキング期間

1 か月

測定単位

ミリ秒

タイムスロット

常時

サービス

CNP システム

サービス ドメイン

パフォーマンス

ドメイン カテゴリ

最長トランザクション応答時間

上記のマトリックスに基づいた場合、実際のサービス レベルはどのように算出されますか。

ドメイン カテゴリ定義に基づくと、実際のサービス レベルが最大値として算出されると考えられます。 つまり、1 か月間に実行されたすべてのトランザクションのうち、最大値が示されたトランザクションがキャプチャされ、この値が目標と比較されます。

: サービス レベルの計算は、一定の期間内に収集された Raw データの総量に基づいて行われます。 期間ごとにメトリックから 1 件の結果が返されます。 メトリックの目標は、単一のトランザクションと比較されるのではなく、その期間内に実行されたすべてのトランザクションを定期的に集計した月次結果と比較されます。 契約マネージャは、この結果に契約が反映されるようにするだけでなく、サービス品質も反映されるようにする必要があります。

応答時間を最大値として測定することは、非常に厳重な義務であり、実際に達成することが極めて困難である点に注意してください。 最大レベルの測定は、1 か月間に実行された 100 万件のトランザクションのうち、751 ミリ秒の単一のトランザクションが契約違反を引き起こすのに十分であることを意味します。 このため、レポート内のバーはすべて赤色になり、提供されたサービスの実際の品質が反映されません。

このような状況における一般的なレポートを以下の図に示します。

目標を超えているトランザクションはすべて契約違反と見なされますが、サービス品質が劣化している場合に実際のサービス品質を把握するための基準になります。この理由は、単一のトランザクションしか反映されず、それ以外のトランザクションに関しては、単一の障害であるか傾向であるかなどの情報が何もわからないためです。 これが単独のインシデントでない場合、1 か月間に何回トランザクションに失敗しましたか。また、1 か月間に実行されたトランザクションの総数のうち、失敗したトランザクションの占める割合はどのくらいですか。 このような状況が発生したために契約違反となった月が複数ある場合、その傾向は何ですか。 この状況は改善されていますか、それともさらに悪化していますか。 このような質問はいずれもサービス レベル マネージャから寄せられる可能性があり、レポートは回答を提示できる必要があります。

: メトリックとそれに関連した計算の概略を定義する場合は、レポートに結果がどのように表示されるかを想定しておくことが非常に重要となります。 このレポートには、以下の 2 つの重要な項目を記載する必要があります。

示唆されたモデリング ソリューション B

平均レスポンス時間

CNP システムのトランザクション応答時間

1 月当たり 750 ミリ秒以下であること

メトリック

平均トランザクション応答時間

ターゲット

750

トラッキング期間

1 か月

測定単位

ミリ秒

ドメイン カテゴリ

平均トランザクション応答時間

平均応答時間の計算では、毎月のサービス品質を十分に把握できます。また同時に、極端な応答時間や契約違反の応答時間が示された月を特定することもできます。

示唆されたモデリング ソリューション C

しきい値内で正常終了したトランザクションの割合

CNP システムのトランザクション応答時間

1 月当たり 750 ミリ秒以下であること

メトリック

正常なトランザクション応答時間

ターゲット

100

トラッキング期間

1 か月

測定単位

成功率

メトリック パラメータ

750 ミリ秒

サービス

CNP システム

サービス ドメイン

パフォーマンス

ドメイン カテゴリ

正常なトランザクション応答時間

タイムスロット

常時

この方法を使用すると、一定の期間内に 750 ミリ秒のしきい値を超えることなく正常に完了したトランザクションの割合が算出されます。この計算には、以下の数式が使用されます。

((750 ミリ秒未満のトランザクションの数)/(トランザクションの総数))*100

また、保証を成功率で表すことにより、厳重な保証(目標 100%)を維持できる一方で、サービス品質の良好度/劣悪度を示す実際の値を確保することもできます。

この方法を使用すると、目標が上限の 750 ミリ秒を超えないことではなく、成功率を維持することになります。 厳重な保証の維持が要求されるケースでは、たった 1 回の失敗の余地もない 100% の目標を設定する必要があります。 このケースに対応するための変数が新規に導入されています(メトリック パラメータ)。 必要に応じて簡単な変更ができるように、このパラメータをメトリック ラメータとして実装する必要があります。

この方法の代替モデルは、強制的にエスカレーション タイプ モデルになる場合があります。

以下のソリューションには、上記のソリューションのように 1 つのメトリックではなく、3 つのメトリックが定義されています。

メトリック

正常なトランザクション応答時間

ターゲット

95

トラッキング期間

1 か月

測定単位

成功率

メトリック パラメータ

750 ミリ秒

メトリック

正常なトランザクション応答時間

ターゲット

99

トラッキング期間

1 か月

測定単位

成功率

メトリック パラメータ

850 ミリ秒

メトリック

正常なトランザクション応答時間

ターゲット

100

トラッキング期間

1 か月

測定単位

成功率

メトリック パラメータ

1000 ミリ秒

契約上の義務だけでなく、750 ミリ秒のしきい値を超えているトランザクションの数も報告することが要求されているケースでは、失敗したトランザクションの数をカウントするメトリックを追加定義する必要があります。

: 一定の期間内に各メトリックから生成される結果は 1 件です。 トランザクションの割合を算出するように設定されている場合は、トランザクションの数も同時に算出することができません。

メトリックから追加レポートを生成するただ 1 つの方法は、ビジネス ロジックの出力を使用することです。 (ビジネス ロジックから結果を出力する方法が記載されている「出力 - ユーザ テーブル」を参照してください。)

メトリック

失敗したトランザクションの数

ターゲット

ターゲットなし

トラッキング期間

1 か月

測定単位

トランザクション数

メトリック パラメータ

750 ミリ秒

サービス

CNP システム

サービス ドメイン

パフォーマンス

ドメイン カテゴリ

トランザクション数

タイムスロット

常時