Debian は AI が生成した貢献については決定しないこととしました。

Summary

Debian の AI 支援貢献に関する議論は、2 月中旬に Lucas Nussbaum が主導して開始されました。草案の General Resolution (GR) は、LLM 生成コードが 厳密な条件 を満たす場合にのみ受け入れられることを提案しています：明示的な「[AI‑Generated]」タグ、使用したツールの開示、および貢献が技術的に健全であること、安全性・ライセンス遵守・有用性が検証されていること。GR はまた、非公開または機密プロジェクトデータ（例：プライベートメールリストや封印されたセキュリティレポート）への生成 AI ツールの使用を禁じています。

参加者は「AI」という曖昧な表現ではなく「LLM」といった正確な用語の重要性を強調し、コードレビュー・プロトタイプ生成・本番コードとの明確な区別を求めました。新規貢献者を AI エージェントでオンボーディングする実務的懸念やスキルギャップ、有料ツールのコスト、そしてこうした貢献が実際に貢献者ベースの拡大に寄与するかどうかについても議論されました。

倫理的観点（特に Matthew Vernon）が、生成 AI ベンダーが著作権を侵害し、環境への影響を悪化させ、誤情報を拡散する可能性を警告しました。これらの懸念は、訓練データの著作権に関する広範な議論へとつながり、一部では法的明確化が得られるまで特定の貢献を一時的に禁止すべきだという提案もあります。

Thorsten Glaser は「slop commits」を含む上流プロジェクトをメインアーカイブから除外するような極端な措置を提案しましたが、これは大部分で不人気でした。コミュニティはまだ AI 生成貢献をポリシー用語でどのように定義するかについて合意していません。

3 月 3 日時点では正式に GR が採択されておらず、議論は礼儀正しく探索的な状態が続いています。Debian は既存のポリシーを用いながらケースバイケースで AI 関連貢献を評価し、全面禁止よりも微妙な保護策を追求します。草案が通過すれば、AI 生成コードの取り扱いに関する他のオープンソースプロジェクトへの参考点となり、貢献者ワークフロー、ライセンス遵守、安全性実践、および業界先例に影響を与える可能性があります。

LWN.netへようこそ
以下のサブスクリプション限定コンテンツは、LWN の購読者によってご提供いただきました。何千もの購読者が、Linux とフリーソフトウェアコミュニティから最高のニュースを得るために LWN に依存しています。この記事がお役に立った場合は、ぜひ LWN の購読をご検討ください。LWN.net をご覧いただきありがとうございます！

Debian と AI 支援による貢献

Debian は、LLM（大規模言語モデル）生成の貢献について「再び」議論するプロジェクトの最新作です。この議論は、2 月中旬に Lucas Nussbaum が Debian が AI 支援による貢献を受け入れるべきかどうかという一般解決案（GR：General Resolution）の草案でディスカッションを開始したことで始まりました。正式な GR の提出や決定は行われていませんが、議論自体は非常に示唆に富んだものとなりました。

Nussbaum は、最近の議論を踏まえ「AI 支援による貢献に関して私たちがどこに立っているか」を検討する必要があると述べました。彼は Debian の立場を明確化するために GR を草案し、数日間フィードバックを待って正式に提出する予定でした。

提案の主なポイント

AI 支援による貢献（LLM が部分的または完全に生成したもの） は、条件が満たされれば許可する。
- 「貢献の重要部分が手動で変更せずにツールから取得された」場合には明示的な開示を義務付ける。
- そのような貢献は
```
[AI‑Generated]
```
  のような明確な免責表示または機械可読タグでラベル付けする。
貢献者は 提出物を完全に理解し、技術的優位性・セキュリティ・ライセンス遵守・有用性について責任を負うこと。
公開されていない情報や機密プロジェクト（プライベートメールリスト、封印済みのセキュリティレポートなど）に対しては、生成 AI ツールの使用を禁止する。

用語の重要性

AI は包括的な用語です。実際に議論されている技術は主に大規模言語モデル（LLM）に関わるものが多いですが、参加者間で「何について話しているか」が異なると、それを許可すべきか否かの判断が困難になります。

Russ Allbery は次のように正確さを求めました。

「AI はあまりにも曖昧に定義されており、宇宙中のあらゆる物体を含む可能性があります。」
彼は政策が規制対象を具体的に明示すべきだと主張しました。

Gunnar Wolf も Allbery に同意し、Nussbaum は特定技術自体よりも「何を扱うか」に関心があると反論しました。議論の中心は、コード解析・生成のための自動化ツールであり、過去の BitKeeper やプロプライエタリなセキュリティ分析ツールに関する議論を思い起こさせます。

Sean Whitton は GR に「AI」ではなく「LLM」を用いるべきだと提案し、コードレビュー・プロトタイプ生成・本番コードなどの使用例を区別しました。彼は一部の使用のみを許可する投票オプションを想定していました。Andrea Pappacoda は明確な境界線が必要であり、AI のような広範な用語は避けるべきだと主張しました。

用語以上に

Simon Richter はオンボーディングの懸念を挙げました。AI エージェントがジュニア開発者を代替し、基本的なタスクを実行するだけで相互作用から学ばない場合、新規貢献者への導入機会を逃す恐れがあります。

Nussbaum はコストの可能性に言及しつつも、現在は無料枠のベンダーが存在していると述べました。将来的には変わるかもしれません。彼は AI が難しいタスクをよりアクセスしやすくする可能性があると指摘し、AI との異なるインタラクションが速度と理解に影響を与えるという研究を引用しました。

Ted Ts’o は AI を否定的な力として捉えることに反対し、実際には新規メンバーの参加障壁を下げることで貢献を促進する可能性があると述べました。

Matthew Vernon は生成 AI の倫理的側面を批判しました。ChatGPT や Claude などの企業は著作権やライセンスを無視してコンテンツを収集し、環境負荷やセキュリティへの懸念が高まっています。彼は Debian がこれらのツールに対して明確な立場を取るべきだと訴えました。

著作権と品質

議論は著作権（トレーニングデータのライセンスや LLM の出力）にも触れました。Jonathan Dowland は「現在は一部の貢献を禁止し、法的明確化が進んだら立場を緩和する」ことを提案しました。

Thorsten Glaser は厳格な見解で、「スロップコミット」を含むプロジェクトは Debian のメインアーカイブから除外すべきと主張し、Linux カーネルや Python、LLVM などの主要アップストリームに影響を与える可能性がある立場でした。この提案は広く受け入れられませんでした。

Allbery はコード品質に焦点を当てました。LLM が生成したコードは乱暴である場合がありますが、人間開発者も不十分なコードを書きます。Bdale Garbee は同意し、AI 生成の変更が長期的に与える影響を理解する必要性を強調しました。

現状

Debian の開発者は AI 生成貢献の共通定義に合意していません。多くの人々は Debian が AI 貢献に関する GR を投票できる段階ではないと考えていますが、議論は礼儀正しく建設的です。現時点では既存のポリシーに基づきケースバイケースで対処しており、このアプローチは複雑さ、多様な意見、急速な技術変化を考慮すると最も混乱が少ないとされています。