エンジニアリングのエラーバジェット カスタムターゲット

カスタムターゲットは、個々のエンドポイントとジョブにカスタマイズされたエラーバジェット期間を設定する機能を導入し、さまざまなワークロードの受け入れ可能なパフォーマンスを適切に定義できるようにします。

エラーバジェットのカスタムターゲットとは?

カスタムターゲットは、個々のエンドポイントとジョブにカスタマイズされたエラーバジェット期間を設定する機能を導入し、さまざまなワークロードの受け入れ可能なパフォーマンスを適切に定義できるようにします。

現在すべてのエンドポイントに使用されているレガシーの Apdex 閾値は 5 秒に設定されています。リクエスト時間が 5 秒を超えると、そのリクエストはこの閾値に違反していると見なされ、エラーバジェットの Apdex 部分に対してカウントされます。これは異なるパフォーマンス特性に対応していないため、このコンポーネントはカスタマイズ可能な Apdex 閾値に置き換えられています。

なぜエラーバジェットにカスタムターゲットを使用するのですか?

パフォーマンスへの期待はワークロードによって異なり、良いユーザーエクスペリエンスの重要な部分を形成することがあります。したがって、所有するさまざまなエンドポイントとジョブに対してどの期間が受け入れ可能かを、顧客と最も近いところで働くチームが定義できるようにすることが重要です。特定のワークロードのパフォーマンスはまた、より大きなシステム全体の影響に貢献する可能性があります - この場合、インフラ部門はターゲット期間を適切に調整するよう要求する場合があります。

ターゲット期間の設定方法

ステージグループは開発者ドキュメントに従ってターゲット期間を設定し、MR で Scalability チームメンバーからのレビューを依頼する必要があります。

開発者ドキュメントには、ターゲット期間の選び方、期間の設定方法、および考慮すべき事項についての説明が含まれています。

ターゲット期間はどのように使用されますか?

ターゲット期間が設定されると、MR が本番環境にデプロイされるとすぐにシステムはそれらのターゲットのデータを記録し始めます。つまり、デプロイ前に発生した違反または成功はステージグループのエラーバジェットに引き続きカウントされます。

現時点では、エラーバジェットはステージグループがカスタマイズ可能な期間の使用にオプトインを選択するまで、5 秒のターゲット期間を使用するレガシー SLI を引き続き使用します。カスタマイズ可能な期間では、デフォルトの閾値(特定のターゲットがないエンドポイントの場合)は 1 秒に設定されています。

ダッシュボード(内部のみ)では、どのステージグループがこの方法にオプトインしているかを確認でき、さらに新しい Apdex 比率(カスタムターゲットに合わせて調整)と古い Apdex 比率(5 秒のデフォルトに基づく)の比較も表示されます。