Development Analytics グループ
共通リンク
| カテゴリ | ハンドル |
|---|---|
| GitLab グループハンドル | @gl-dx/development-analytics |
| Slack チャンネル | #g_development_analytics |
| Slack ハンドル | @dx-development-analytics |
| チームボード | Team Issues Board, Team Epics Board, Support Requests |
| Issue トラッカー | tracker |
| チームリポジトリ | development-analytics |
ミッション
私たちのミッションは、実用的なインサイトを提供し、品質・CI・関連メトリクスによってチームを強化し、チームと顧客のソフトウェア開発ライフサイクルを測定可能な形で改善するスケーラブルなツールを構築することで、開発者の効率を向上させることです。
ビジョン
Infrastructure Platforms 部門の KPI の確立と施行をサポートします。チームはメトリクスとレポートを統合し、エンジニアから VP+ レベルまで測定可能な DevEx と品質情報を提供します。
- すべてのテストスイート、ジョブ、パイプラインからのデータ可視化を実現します。
- エンジニアリングチームがテストカバレッジ、テスト実行時間、不安定さ、バグ数などの品質を評価・改善できるようにするダッシュボードとレポートを作成・統合します。
- テストスイートの有効性、エンジニアと顧客によって特定されたバグ、インシデント、その他の本番データについて DevEx セクションとプラットフォームに情報を提供し、エンジニアリングチームを導きます。
- 私たちが構築したものから顧客も恩恵を受けられるよう、GitLab 製品自体にソリューションを組み込むことを目指します。
FY26〜FY27 ロードマップ
現在 FY26-Q4
フォーカス: エンジニアリングチームがテストの健全性データに自己サービスでアクセスできるよう可視性とプロセスを改善します。Devex データとダッシュボードを統合します (FY26-Q3 〜 FY26-Q4)
| エピック | 説明 |
|---|---|
| パターン検出と相関のための CI 障害シグネチャの構築 | Q3 からの継続、ClickHouse データストアに障害カテゴリとシグネチャを追加します。これにより CI 障害に関するリアルタイムのダッシュボードとアラートが実現し、マスターブロークンインシデントをより迅速に特定するために必要なデータが整備されます。これはパイプライン安定性改善の基盤となる要素として機能します。 |
| すべてのテストレベルにわたる単一バックエンドテスト可観測性ソリューションの構築 | Q3 からの継続、ClickHouse ベースのテスト可観測性ダッシュボード。これらのダッシュボードは不安定なテストの特定と修正/削除/隔離の作業を支え、作成した特定の不安定なテスト Issue へのディープリンクをサポートし、エンジニアがテストの健全性に対する可視性を大幅に向上させます。 |
| フレーキーテストの隔離プロセスの改善 | ClickHouse ベースのデータに移行することでフレーキーテストの検出を改善し、CI 安定性を推進するため Test Governance の自動隔離システムをサポートします。ここでの成功指標はフレーキーテストの数を減らし、不要なパイプライン失敗を削減することです。 |
| CI 失敗を確認し、パイプラインを失敗させるインフラ関連の主要な理由が対処されていることを確認する | CI 安定性に関する DX サーベイアクションに合わせ、CI 失敗の主な理由(インフラの問題やタイムアウトなど)を見直し、担当チームに解決すべき Issue を作成します。ここでの成功指標は不要なパイプライン失敗の量を削減することです。 |
| ClickHouse と Grafana によるテストカバレッジ可観測性の導入 | エンジニアリングチームはコードベース全体のテストカバレッジのトレンドやパターンに対する可視性が欠けています。CI/CD 中にカバレッジデータが生成されていますが、短命なアーティファクトに閉じ込められています。これはカバレッジをチームに提供するための基盤コンポーネントであり、隔離または削除されたテストなどがカバレッジに与える影響を理解できるようにします。 |
| TBD | ダッシュボードを使用した SaaS 可用性コールのサポート |
| CI 関連の Development Analytics Snowflake ダッシュボードとデータを ClickHouse/Grafana に移行する | CI 関連の Development Analytics Snowflake ダッシュボードとデータを ClickHouse/Grafana に移行して発見可能性を改善します。 |
| 既存の Devex ダッシュボードを新しいデータパスに移行する | Devex ダッシュボードとデータを Grafana/ClickHouse に統合することをサポートします。 |
Q4 計画 Issue も参照してください: https://gitlab.com/gitlab-org/quality/analytics/team/-/issues/309
次 FY27-Q1/Q2
フォーカス: 改善されたドキュメントとチーム向けの集中ランディングページを使用してデータ/ダッシュボードの使用をスケールアウトします。パイプラインテレメトリを改善し、エンジニアリングチームが CI パフォーマンスを改善できるようにする製品機能を構築します (FY27-Q1 〜 FY27-Q2)
- 回復時間を改善するためのマスターブランチ破損の検出プロセスの改善
- チームがダッシュボード/アラートを使用できるようにするドキュメント/トレーニング/オフィスアワーセッション
- スケーラブルな CI ジョブテレメトリレポートの構築(製品に組み込み、ランナー経由)
- データインサイトプラットフォームダッシュボード機能のドッグフーディング(準備ができた場合)
- トリアージ Ops のメンテナンスと改善(例: トリアージ Ops を Runway に移行)
後期 FY27-Q3 以降
フォーカス: カスタムツールから製品機能への移行
- チームが所有するカスタムツールを製品に組み込むことを優先します。
チームメンバー
チームメンバー情報は 原文 (英語) を参照してください。
コア責任範囲
flowchart LR
DA[Development Analytics Team]
DA --> MRCT[MR Cycle Time Improvement]
DA --> Tools[Tooling Maintenance]
MRCT --> Analytics[Analytics & Observability]
MRCT --> ExecTime[Pipeline Execution Time Optimization]
MRCT --> ReviewEng[Review Engagement Enhancement]
MRCT --> PipeStab[Pipeline Stability Insights]
Tools --> Triage[Triage Ops]
Tools --> Roulette[GitLab Roulette]
Tools --> Danger[Dangerfiles]
Tools --> EPInfra[Engineering Productivity Infrastructure]
Tools --> CNG[CLI for Cloud Native GitLab deployment]
click Triage "https://gitlab.com/gitlab-org/quality/triage-ops"
click Roulette "https://gitlab.com/gitlab-org/gitlab-roulette"
click Danger "https://gitlab.com/gitlab-org/ruby/gems/gitlab-dangerfiles"
click EPInfra "https://gitlab.com/gitlab-org/quality/engineering-productivity-infrastructure"
click Analytics "https://gitlab.com/groups/gitlab-org/-/epics/16185"
click ExecTime "https://gitlab.com/groups/gitlab-org/-/epics/15989"
click ReviewEng "https://gitlab.com/groups/gitlab-org/-/epics/16028"
click PipeStab "https://gitlab.com/groups/gitlab-org/-/epics/16186"
click MRCT "https://gitlab.com/groups/gitlab-org/-/epics/16026"
click CNG "https://gitlab.com/gitlab-org/gitlab/-/tree/master/qa/gems/gitlab-cng"ダッシュボード
Development Analytics のダッシュボードは Developer Experience ダッシュボードページに掲載されています。
メトリクス
Development Analytics グループはエンジニアリングの生産性、品質、効率性を測定するメトリクスを開発・維持しています。以下の各メトリクスは、定義、方法論、現在のステータス、既知の制限とともに文書化されています。
欠陥脱出率
現在のステータス
- 成熟度: アルファ版
- 更新: 毎月(E2E 環境の手動データ収集)
- ダッシュボード: 欠陥脱出率(Snowflake)
何を、なぜ
欠陥脱出率は、ソフトウェア開発ライフサイクル全体で自動パイプラインとテストによって検出された欠陥と比較して、本番に漏れた欠陥の割合を測定します。このメトリクスはテスト戦略とシフトレフト実践の有効性を示します。低い率は、欠陥が顧客に届くのを防ぐ強固な品質ゲートを示しています。
このメトリクスは製品グループによるドリルダウンをサポートし、グループが自身の欠陥検出の有効性を追跡できるようにします。
仕組み
「欠陥」を 2 つの方法で測定しています:
- 漏れた欠陥: 本番バグ(
type::bugラベルが付いた Issue) - 検出された欠陥: 問題のあるコードが本番に届くのを防いだ失敗したパイプライン/テスト
この計算式は本番に届いた欠陥の割合を計算します:
欠陥脱出率 = 漏れた欠陥 / (漏れた欠陥 + 検出された欠陥)
「漏れた欠陥」としてカウントするもの:
gitlab-org/gitlabプロジェクトのtype::bugIssue(カノニカルスコープ)- または
gitlab-orgとgitlab-comグループのtype::bugIssue(広いスコープ)
「検出された欠陥」としてカウントするもの:
失敗したパイプラインを検出された欠陥のプロキシとして使用し、パイプラインの失敗が問題のあるコードのさらなる進行を防いだと仮定します。
以下の SDLC ステージにわたってカウントします:
- MR パイプライン -
gitlab-org/gitlabとgitlab-org/gitlab-fossの失敗したパイプライン - マスターパイプライン - マスターブランチでの失敗したパイプライン
- デプロイ E2E テスト - デプロイ環境に対して実行される失敗した E2E テストパイプライン:
- Staging Canary, Staging Ref, Production Canary, Staging, Production, Preprod, Release (ops.gitlab.net から)
- Dedicated UAT (gitlab.com から)
注意: E2E メトリクスは各環境を検証するために失敗したテストパイプラインを追跡しており、デプロイパイプライン自体からの失敗ではありません。これらは顧客への影響前の品質ゲートとして機能します。
gitlab-foss の場合: 直接的な失敗のみ(push、schedule、merge_request_event ソース)がカウントされます。親 gitlab-org/gitlab パイプラインですでに取得された失敗を二重カウントしないよう、ダウンストリームパイプライン(ソース = pipeline または parent_pipeline)は除外されます。
測定精度に関する重要なコンテキスト:
現在の実装は「失敗したパイプライン」を「検出された欠陥」のプロキシとして使用していますが、これには機能的な欠陥を示すテスト失敗だけでなく、すべてのパイプライン失敗(インフラの問題、タイムアウト、リンティングエラーなど)が含まれます。この広い定義により、欠陥脱出率の値は約 5〜10% になります。
テスト失敗のみ(機能的な欠陥)を測定する将来のイテレーションでは、欠陥脱出率の値は約 20〜40% になる可能性があります。この増加は、多くのパイプライン失敗が顧客に影響するコードの欠陥ではなく非機能的な問題(インフラ、設定)を検出するという、より正確な測定を反映しています。より高い割合は品質の低下を示すのではなく、機能的な欠陥を検出するテストの有効性のより正確な測定を示しています。
グループレベルの欠陥脱出率:
欠陥脱出率は MR の group:: ラベルを使用して製品グループでフィルタリングできます。基本的な仮定は、特定のグループのエンジニアが主に自分たちが担当するコードの欠陥を生成するということです — テストスイートが検出すべき欠陥です。
具体的には:
- Issue の
group::ラベルを介してグループに割り当てられたバグ - マージリクエストの
group::ラベルを介してグループに割り当てられた MR パイプライン失敗 - MR パイプライン失敗のみが帰属可能(マスターパイプラインや E2E テストパイプラインには
group::ラベルがない)
MR と Issue には常にグループラベルが設定されているとは限りません(例: 2025 年 10〜12 月の MR の 13% と Issue の 6% にはグループラベルがなかった)。
将来のイテレーションでは、MR の著者からオーナーシップを推測するのではなく、どのテストが失敗したかを直接測定するために、テストオーナーシップ(feature_category)を使用したグループ帰属が理想的です。これにはバックエンドテストだけでなく、すべてのテストフレームワークにグループオーナーシップデータを追加する必要があります。
既知の制限
データ収集:
- E2E パイプライン失敗は ops.gitlab.net API 経由で手動で取得(自動化されていない)
- ops.gitlab.net パイプラインデータは ClickHouse または現在の Snowflake で利用不可(レガシーデータは 2025 年 8 月に停止)
- ClickHouse はこのメトリクスの優先プラットフォームだが、現在は必要なデータのほとんどが欠如(Issue、マージリクエスト、E2E パイプライン)。2026 年 Q1 にこのデータを追加予定。
グローバル欠陥脱出率の制限:
- 現在のバージョンは機能的なテスト失敗だけでなく、すべてのパイプライン失敗(インフラ、タイムアウト、リンティング)をカウント
- データが利用可能になったら、ClickHouse でのより正確なテストのみの測定が理想的
グループ帰属の制限:
- グループレベルの欠陥脱出率は MR パイプライン失敗のみを含む(マスター/E2E 失敗はそれらのパイプラインにグループラベルがないため帰属できない)
- グループの欠陥脱出率は、分母が小さいため(全 SDLC ステージではなく MR のみ)グローバルの欠陥脱出率よりも高くなる
- MR ラベルの帰属は、エンジニアが主に自身のコード領域に欠陥を作成すると仮定しているが、クロスファンクショナルな作業には適用されない場合がある
- MR と Issue には常にグループラベルがあるとは限らない
メトリクスの変動性:
欠陥脱出率は本来可変であり、実際の品質改善とは無関係な要因に影響される可能性があります:
- マスターブロークンインシデントは一時的に「検出された欠陥」を増加させ(マスター失敗が急増)、欠陥脱出率を人為的に低下させる
- インフラの問題によるパイプライン失敗は分母を増加させ、テストの改善なしに欠陥脱出率を低下させる
- フレーキーテストによる偽の失敗は「検出された欠陥」を増加させ、改善の偽の印象を作り出す
- CI キャパシティの制約はパイプライン実行を削減し、欠陥を隠す可能性がある
これらの交絡因子をフィルタリングできるまで、月次の欠陥脱出率の変化は慎重に解釈する必要があります。複数月にわたる継続的なトレンドは単月の変動よりも意味があります。
計画された改善
2026 年 Q1:
- ops.gitlab.net から ClickHouse への E2E パイプラインデータ取り込みの自動化
- 完全な自動化のために Issue とマージリクエストデータを ClickHouse に追加
- ClickHouse でのダッシュボードの構築
- RSpec または Jest テスト失敗によるパイプラインのみをカウントするよう「検出された欠陥」を改善(注: フレーキーテストやマスターブロークンインシデントはまだ含まれる)
将来:
- よりクリーンな測定のためにインフラの失敗、フレーキーテスト、マスターブロークンインシデントをフィルタリング
- どのテストが失敗したかに基づいた正確なグループ帰属を実現するためにテストオーナーシップデータ(
feature_category)を拡張
働き方
哲学
- GitLab の完全リモート、タイムゾーン分散型の構造に沿って、非同期コミュニケーションとハンドブックファーストのアプローチを優先しています。
- 生産的で中断されない作業に焦点を当てた Maker’s Schedule を重視しています。
- 最も重要な定期ミーティングは火曜日と木曜日に予定されています。
- 集中した学習とイノベーションのために週 3〜4 時間を確保しています。この保護された時間により、チームが新興技術を探索し、概念実証を実施し、業界のトレンドについて常に把握できます。この時間帯のミーティングリクエストには事前通知が必要です。
- すべてのミーティングのアジェンダはチーム共有ドライブおよびミーティング招待にあります。
ミーティング/イベント
| イベント | 頻度 | アジェンダ |
|---|---|---|
| 週末進捗アップデート | 週 1 回(水曜日) | Issue とエピックの週次アップデートにステータス、進捗、ETA、サポートが必要な領域をまとめます。自動ステータスチェックのために epic-issue-summaries ボットを活用しています。 |
| チームミーティング | 月 2 回、火曜日 16:00 UTC | アジェンダ |
| 月次ソーシャルタイム | 月 1 回、最終木曜日 16:00 UTC | アジェンダなし、楽しい集まりです。タイムゾーンの整合性に基づいていずれかのスロットを選択してください。バーチャルチームビルディングをお読みください。 |
| 四半期ビジネスレポート | 四半期ごと | 各ビジネス四半期のチームの成功、学び、イノベーション、改善機会に貢献します。 |
| エンジニアリングマネージャーとの 1:1 | 週次 | 開発目標について話し合います(1:1 ガイドラインを参照) |
| チームメンバーのコーヒーチャット | 月 1〜2 回 | チームメンバーが定期的につながるためのオプションのミーティング |
年次ロードマップ計画
- 各会計年度に、可視性と整合性を確保するためのロードマップを作成します。
- 通常 Q4 に、ステークホルダーから意見を収集するために集中的な 1 ヶ月間の作業を実施します。
- DRI はロードマップ準備作業テンプレートを使用してロードマップのドラフトを作成するリードを務めます。
- ロードマップが承認されたら、隔週のチームミーティングで、計画されたロードマップ作業の進捗を確認し、ブロッカーに対処し、フィードバックを収集します。
イテレーション
年次ロードマップが定義されたら、月 2 回のイテレーションモデル内で GitLab イテレーションを使用して作業を構造化します。このアプローチにより、一貫した進捗追跡、明確な優先事項、および継続的な改善が確保されます。参考として、現在のイテレーションボードと過去のイテレーションがあります。チームとして以下を確保します:
- 各 Issue が Development Analytics イテレーションに割り当てられています。
- イテレーション内で作業されなかった Issue は自動的に次のイテレーションにロールオーバーされます。
- 隔週のチームミーティングごとに、イテレーションボードをレビューし、バーンダウンチャートを使用してベロシティを追跡します。
内部ローテーションとサポートリクエスト
内部ローテーション
サポートリクエストやその他のチームメンテナンスタスクのために内部ローテーションを使用しています。これにより、チームの他のエンジニアが計画された作業に集中できる時間が確保されます。
サポートリクエスト
- バグを発見したり、支援が必要な場合、または改善の機会を特定した場合は、
~"group::Development Analytics"と~"development-analytics::support-request"ラベルを使用してサポートリクエストを提出してください。緊急の場合は、指定された Slack チャンネル -#g_development_analyticsにエスカレーションしてください。 - リクエストが最初に Slack 経由で来た場合は、リクエスト者または
group::Development Analyticsメンバーが適切なラベルで Issue を開いて、適切なトラッキングとトリアージを確保してください。 - チームはサポートリクエストボードをレビューし、それに応じて優先順位を付けます。一般的に、チームはサポートタスクに週次時間の約 20% を確保していますが、現在の優先事項によって異なる場合があります。
ツール/リポジトリのメンテナンス
- チームはグループが所有する各リポジトリに作成されたすべての新しい Issue を自動的に監視しているわけではありません — 可視性を確保するためにグループラベルを使用するか、Slack でエスカレーションしてください。
- セルフサービスのマージリクエストを強く推奨します。すでに修正や改善を特定している場合は、より迅速なターンアラウンドのために MR を開くことを推奨します。
~group::development analyticsのメンテナーが適宜レビューしてマージします。 - 機能作業とバグ修正はチームの現在の優先事項に従います。
~group::development analyticsが所有するリポジトリのバージョン管理に関する慣習を参照してください:
| リポジトリ | リリースプロセス |
|---|---|
| gitlab-roulette | バージョン更新は設定されたスケジュールでは行われません。バージョン更新 MR が提出されると随時リリースが行えます。 |
| gitlab-dangerfiles | 上記と同じ — 定期的なスケジュールはなく、バージョン更新 MR によってリリースがトリガーされます。 |
| triage-ops | デフォルトブランチに新しいコミットがマージされた後に新しいリリースが開始されます。 |
| engineering-productivity-infrastructure | 依存関係更新 MR は Renovate ボットによって生成されます。 |
自動ラベルマイグレーション
ラベルマイグレーションの詳細については、GitLab Duo Workflow でラベルマイグレーショントリアージポリシーを作成するためのハンドブックエントリを参照してください。
