緊急事態例外ワークフロー
いくつかの例とともに緊急事態の例外プロセスを説明します
はじめに
サポートエンジニアおよびマネージャーは、GitLab 顧客からの運用上の緊急事態を調整します。ただし、緊急事態として提起されたすべてのチケットが、severity 1 case のサポート影響の定義 に厳密に当てはまるわけではありません。このワークフローでは、ビジネス影響が高いものの、緊急事態の定義に厳密には合致しないケースに遭遇した場合の対応を説明します。
例外基準
次のいずれかが該当する場合、緊急事態の厳密な定義の例外が認められる場合があります:
- 問題が、即時的または事後的に顧客の会社に重大な財務的影響をもたらす
- 問題が、業務目的での GitLab を実質的に使用不能にしている:
- 1 つまたは複数の GitLab サーバーまたはサービスが起動しない
- 顧客の日常業務に不可欠な GitLab 機能が利用できない
- GitLab インスタンスが重大かつ持続的なパフォーマンス低下に陥っている
clone、push、ログインなどの基本操作が、ユーザーの相当部分で機能しない
- 問題が顧客のビジネスに即時の法的問題を引き起こす
- 問題が顧客のビジネスに即時の監査問題を引き起こす
- 問題が顧客のビジネスに即時のセキュリティリスクを引き起こす
例外として認められる(または認められない)状況の例
以下は、顧客が GitLab サポートに緊急事態として送信する可能性のある問題のサンプルリストです。各問題について、緊急事態として認められる、または認められないバリエーションを説明し、私たちの判断の簡単な要約を提供します。
ライセンスが期限切れになり、新しいライセンスを適用できない
- 緊急: GitLab の有料機能の不在が、例外基準 にリストされている問題の 1 つ以上を引き起こしている
- 緊急事態ではない: 顧客が GitLab の有料機能なしでもほぼ通常通りビジネスを進められる
- 判断理由: 期限切れのライセンスを削除することで、顧客は GitLab のすべての無料機能をまだ使用できます。顧客が 1 つまたは複数の有料機能に大きく依存している場合のみ、これが緊急事態として認められます。
GitLab ページで 4xx または 5xx エラーが発生している
- 緊急: 顧客がすべてのページですべての GitLab からエラーを取得している
- 緊急事態ではない: 顧客がいくつかのページまたは個別のプロジェクトでエラーを取得している
- 判断理由: 問題のスコープは何ですか? ほとんどのページが正常な場合、これは恐らく緊急事態としては認められません。
ユーザーが GitLab にログインできない
- 緊急: すべてのユーザーがログインできない
- 緊急事態ではない: 一部の人はログインでき、一部の人はできない
- 判断理由: 誰もログインできない場合、インスタンスは使用不能であり、これは緊急事態です。
パイプラインが詰まっている
- 緊急: 顧客がこれをすべてのプロジェクトで見ている
- 緊急事態ではない: 顧客がこれをすべてではなくいくつかのプロジェクトのみで見ている
- 判断理由: 歴史的には、GitLab インスタンスがこれらの状況でダウンしていないため、詰まったパイプラインは緊急事態として認められませんでした。私たちは、詰まったパイプラインが重要なビジネスプロセスがダウンしていることを意味する可能性があり、これが緊急事態を示す可能性があることに気付きました。スコープも確認する必要があります。影響を受けているのはいくつかのプロジェクトだけですか、それともほとんどまたはすべてが影響を受けていますか? 後者で、詰まったパイプラインが重要なビジネスプロセスをブロックしている場合、状況は緊急事態として認められます。
顧客が自社の GitLab インスタンスでパフォーマンス低下を経験している
- 緊急: インスタンス全体が、実質的に使用不能になるほど遅い動作をしている
- 緊急事態ではない: 単一のページの読み込みが遅い、または GitLab は使用可能だが通常より遅い
- 判断理由: GitLab インスタンスが、ユーザーが通常より桁違いの時間(1 秒の代わりに 10 秒、秒の代わりに分など)座って待たなければならないほど遅く動作している場合、インスタンスは事実上使用不能です。また、システムパフォーマンスがますます低下していると、システムがハングまたはクラッシュする状態に急速に変わる可能性があります。
GitLab Geo セカンダリサイトがレプリケーションしていない
- 緊急: 顧客が、規制要件を満たすために明日に予定されたディザスタリカバリフェイルオーバー演習を持っている。
- 緊急事態ではない: 顧客が、規制要件を満たすために来月に予定されたディザスタリカバリフェイルオーバー演習を持っている。
- 判断理由: 計画されたディザスタリカバリフェイルオーバー演習を実行しないと、顧客のビジネスに即時のコンプライアンス問題を引き起こし、罰金につながる可能性があります。タイムラインが非常に短い場合、これは緊急事態として認められます。それ以外の場合、業務継続性のためセカンダリサイトを迅速に復元することは依然として重要なので、顧客の同意の下、これは優先度を ‘high’ に設定した通常のサポートチケットとして扱うことができます。
GitLab Geo セカンダリサイトが不健全だが、ゆっくりレプリケーションしている
- 緊急: 「レプリケーションしていない」ケース を参照、またはレプリケーションラグが妥当な速度で減少していない場合。
- 緊急事態ではない: レプリケーションが遅延している が、健全な状態に向けて妥当な速度で進んでいる。例: プライマリに大量のデータが追加された後で、セカンダリのネットワーク帯域幅を増やせない場合。
- 判断理由: レプリケーション パフォーマンス は多くのさまざまな理由で低くなる可能性があり、その一部は サポート対象外の理由 です。調査の期間は、期待できる速度向上の量と妥当な関係でなければなりません。
インスタンスのアクセストークンまたは SSH キーが機能しなくなった
- 緊急: インスタンスのすべてのアクセストークンまたは SSH キーが機能しなくなった
- 緊急事態ではない: 単一のアクセストークンまたは SSH キーが機能しなくなった
- 判断理由: 顧客の GitLab インスタンスがほとんどのユーザーで使用可能であれば、これは緊急事態ではありません
ユーザーがプロジェクトに対してクローンまたはプッシュできない
- 緊急: すべてのユーザーがほとんどまたはすべてのプロジェクトに対してクローンまたはプッシュできない
- 緊急事態ではない: 少数のユーザーが任意の数のプロジェクトに対してクローンまたはプッシュできない
- 判断理由: これらの機能が顧客の標準的な作業方法であり、誰も使用できない場合、GitLab が実質的に使用不能であるため、緊急事態の基準を満たします
公開アクセス可能でパッチ未適用の Self-Managed GitLab サーバーに影響するセキュリティインシデント
- 緊急: セキュリティインシデントは非常に動揺するものであることを理解しているため、30 分以内に対応することですべて緊急事態として扱いたいと考えており、その対応は恐らく Zoom 通話ではなく、アクセスを防ぐ対策を実装し、その後バックアップから復元するように顧客に助言します。
- 判断理由: セキュリティインシデントは、不正アクセスとデータ侵害の可能性を防止または制限するために、サポートからの即時対応を必要とします。
GitLab.com に影響するセキュリティインシデント
- 緊急: パスワードまたはトークンが漏洩または公開されており、顧客の GitLab.com リソースへの不正アクセスを許可する可能性があります。このタイプの緊急事態を処理するには GitLab.com SIRT 緊急事態ワークフロー に従ってください。
- 判断理由: セキュリティインシデントは、不正アクセスとデータ侵害の可能性を防止または制限するために、サポートからの即時対応を必要とします。
GitLab Duo Pro/Enterprise 機能が利用できない
- 緊急: GitLab Duo Pro/Enterprise 機能がすべてのユーザーで完全に利用できないか、ひどく低下している
- 緊急事態ではない: GitLab Duo Core の Issue、または GitLab Duo Pro/Enterprise の Issue でビジネス影響が最小限、もしくは顧客がブロック解除のために即座に実装できる実行可能な回避策がある
- 判断理由: 顧客は GitLab Duo Pro/Enterprise を追加サービスとして特に支払っているため、利用できないことは支払った投資とサービスの期待に直接影響します
緊急事態ではない状況
サードパーティ統合が機能していない
- 判断理由: これはサードパーティが対処すべき問題です
別のチケットに注意を引きたい
- 判断理由: チケットに注意を引くことは、緊急事態を宣言することではなく、私たちの STAR プロセスを通じて達成されます。
Docker Hub レート制限がイメージのプルを妨げている
- 判断理由: Docker Hub のレート制限は、レジストリミラーをセットアップすることで回避できます
構成支援
- 判断理由: 新しいインスタンスや機能の構成は、GitLab サポートの範囲外です
カスタムスクリプトが機能しない(アップグレードスクリプト、構成管理スクリプトを含む)
- 判断理由: カスタムスクリプトは GitLab サポートの範囲外です
Elasticsearch 統合が機能していない
- 判断理由: Elasticsearch は私たちの高度な検索機能にのみ必要です。それがなくても基本的な検索は引き続き使用できます。
最終更新 June 14, 2026: Merge pull request #403 from kyama0/claude/cool-turing-ls6eck (
bfd74782)