CI キュー待ち時間安定化 ワーキンググループ

GitLab CI キュー待ち時間安定化ワーキンググループは、GitLab.com における CI ジョブのキュー待ち時間の安定性と予測可能性を高めることを目的としています。

属性

プロパティ
作成日2019年11月1日
終了日2019年1月22日
Slack#wg_ci_queue_stability(社内からのみアクセス可能)
Google DocCI Queue Stability Working Group(社内からのみアクセス可能)
Issue ラベルwg_CIQueueStability(gitlab-com/-org)

ビジネス目標

GitLab.com における CI ジョブのキュー待ち時間の安定性と予測可能性を高めます。

目的は以下のとおりです:

  1. 共有ランナーの CI ジョブキュー待ち時間が合理的な期待値を超える状況を分析・修正する
  2. CI ジョブキューの期待値により正確に対応するメトリクスを定義し、アラートを調整する
  3. CI ジョブキュー待ち時間が過大になった場合に使用するトラブルシューティングおよび調査ガイドを作成する
  4. システムの健全性と成長に関する予測分析を実施し、将来予想されるボトルネックを解消する Issue を作成する

終了条件

  1. システムの動作が期待値と一致しなくなったときにトリガーされるメトリクスとアラートを作成・調整する -> 完了
  2. 上記で調整されたアラートが発火しない状態が 1 週間継続する -> 完了
  3. 異常な動作を正常に診断・対応・復旧するためのランブック情報の文書化を公開または更新する -> 完了

成果物

  1. ci-runners service has a apdex score (latency) below SLO アラートがトリガーされる可能性がある場合のための更新済みランブック

ロールと責任

ワーキンググループの役割担当者役職
ファシリテーターElliot RushtonEngineering Manager, Runner
エグゼクティブスポンサーChristopher LefelhoczSenior Director of Development
エンジニアリングリードTomasz MaczukinBackend Engineer
インフラリードAndrew NewdigateDistinguished Engineer, Infrastructure
メンバーDarby FreySenior Engineering Manager, Verify
メンバーSteve AzzopardiBackend Engineer
メンバーDarren EastmanSenior Product Manager, GitLab-Runner
メンバーKamil TrzcińskiDistinguished Engineer