GitLab モデルベンダー選定ガイドライン
目的とスコープ
このガイドラインは、GitLab Duo (GitLab Duo Agent Platform を含む) の機能を支えるモデルを開発するベンダー (「モデル開発者」) と、それらのモデルをホストするベンダー (「モデルホスト」、両者を合わせて「モデルベンダー」) を評価・選定するための GitLab のフレームワークを確立します。モデルベンダーには、(1) GitLab の Subprocessor と (2) そのモデルが GitLab または GitLab Subprocessor によってホストされているベンダーのみが含まれ、GitLab Duo Self-Hosted でサポートされているモデルのベンダーは除外されます。このガイドラインは、すべての新しいモデルベンダーの選定に適用されます。
中核的要件
1. データプライバシー
私たちは GitLab Duo をプライバシーを最優先に構築しており、モデルホストにも同じ基準を求めます。
最低限、モデルホストには以下を求めます。
- GitLab および GitLab の顧客のプライベートデータをトレーニングに使用しないこと、およびそれを契約上コミットすること
- GitLab 顧客の入力と出力のデータ保持期間を、サービス運用に必要な範囲に制限すること
2. 倫理的懸念
GitLab は、包括的な DevSecOps プラットフォームに AI を責任を持って組み込むことに尽力しています。ガードレールなしでは、AI 機能は倫理的な懸念を引き起こす可能性があることを認識しています。
モデル開発者には、これらの倫理的懸念を考慮し、それに対処するために取り組むことを求めます。これには、トレーニングデータのプロセスにおけるバイアスと潜在的な害を軽減するための措置を講じたことを証明することも含まれます。
3. リスクの配分
GitLab は、強力で信頼できる GitLab Duo 機能を構築するために協力してくれるモデルホストを求めています。モデルホストには、(a) 顧客が入力の所有権を保持できるようにすること、および (b) その顧客のために生成されたすべての出力を顧客に割り当てること (適用法で許可される範囲で) を求めます。
4. レピュテーションリスク
私たちのモデルベンダーの製品は、最も重要な機能のいくつかを支えるのに役立っています。そのため、新しいモデルベンダーを選定する際には、潜在的なレピュテーションリスクを慎重に評価します。
新しいモデルベンダーがもたらすレピュテーションリスクを検討する際、以下を考慮します。
- どのくらいの期間運営されているか、業界で確立された実績があるか
- 資金調達があるか、ある場合はどの程度か
- どの組織と提携しているか
- どの国で運営しているか
- 過去にネガティブな報道を受けたことがあるか
5. 透明性
透明性は GitLab の CREDIT バリューの一つの中核的な価値観であり、モデルベンダーにもこの価値観を優先することを期待します。
検討対象となるためには、モデルホストはバグレポートと解決のためのプロセスを提供する必要があります。
6. セキュリティ
GitLab は DevSecOps プラットフォームであり、すべての GitLab Duo 機能にセキュリティを統合するように努めています。このプラクティスに沿って、AI 機能を支えるモデルホストには以下を実装することを期待します。
- モデルポイズニングや敵対的攻撃に対する堅牢なセキュリティ対策
- 業界標準の認証、認可、アクセス、システムおよびネットワークセキュリティ、データガバナンス、リスク管理のコントロール
- 回復力のある事業継続および災害復旧コントロール
- 定期的なセキュリティアップデートとパッチ管理
- 適切なインシデント対応と侵害通知の手順
モデルホストには、少なくとも Security、Confidentiality、Availability の信頼原則をカバーする SOC2 Type 2 レポートと、有効な ISO 27001 認証を持つことを要求します。
7. パフォーマンスと品質
GitLab は、モデルホストがグローバルに利用可能なモデルデプロイメントを提供し、レイテンシ、精度、出力品質、コスト効率に関する強力な指標を示すことを期待します。場合によっては、グローバルにデプロイされていない場合でも、強力なレイテンシパフォーマンスを持つモデルを検討することがあります。
8. サステナビリティ
モデルベンダーには、AI モデルの開発とデプロイメントを通じて、可能な限りサステナブルなプラクティスを採用することを期待します。GitLab は、典型的なワークロードの推定エネルギー消費量、推論/トレーニングセッションごとの炭素排出量、使用される計算方法、実装される最適化技術などの詳細を収集することを目指します。
bfd74782)