
2026/06/13 9:51
米国政府が「Fable 5」と「Mythos 5」へのアクセス停止に関する声明
RSS: https://news.ycombinator.com/rss
要約▶
Japanese Translation:
米国政府は、国家安全保障上の懸念を理由に、Anthropic に高度な Fable 5 および Mythos 5 AI モデルへのアクセスを外国籍の人物に対して即時に停止することを命じた。同社はこれらの特定のモデルと制限付きツールの利用を無効化する一方で、他のすべてのモデルの稼働は引き続き維持することが必要となった。当局は、Fable 5 の安全性の safeguards を回避しうる「jailbreaking」手法が存在すると見ているが、Anthropic はこの評価に異議を唱え、想定されている脆弱性は OpenAI の GPT-5.5 を含め他の業界モデルにもすでに存在しており、その展開に対して独自に脅威をもたらすものではないと主張している。限られた調査に基づいた誤解に基づくものであるにもかかわらず、Anthropic は技術的な見解の相違があるものの、法的指図に従い展開を停止しなければならない結果、アクセス制限の影響を受ける顧客に対し即座にサービス中断が引き起こされた。同社は謝罪し、24 時間以内により詳細な情報を共有すると約束した。この事件は、急速に変化する技術的風景における AI セーフティの現実的な課題と厳格な規制措置の間で高まる緊張関係を示している。
本文
Anthropic による Fabler 5・Mythos 5 の利用停止と政府指令への対応
状況概要と停止理由
- 指令の内容: 米国家安全保障省は、国家安全保障上の懸念を理由に、国内外を問わず外国人(Anthropic 従業員含む)の Fabler 5 および Mythos 5 アクセスを一切禁止する。
- 実効措置: 法令遵守のため、すべての顧客に対し Fabler 5 および Mythos 5 の利用を即座に停止。他モデルへの影響はありません。
- 指令受領時刻: 今日(東部時間午後 5 時 21 分)。
- 政府の指摘: 書簡には詳細未明だが、Fabler 5 の「ジールブレイク回避手法」を理解していることが示唆されています。
Fabler の防護策と脆弱性の現状
Anthropic はリリース時点で以下の姿勢を表明していました:
- 堅牢な防護策: サイバーセキュリティタスクへの誤用リスクを大幅に低減するため、多様な防御技術を導入。
- 徹底的な検証: 米国政府、英国 AISI、民間第三者組織などと連携し、数千時間のレッドチーム試験を実施。既存モデルよりも大幅に優れた防護策であることを示しました。
- 「万能ジールブレイク」の不在: テスト担当者が「万能型回避手法」を見つけることを未だ果たせていませんでした。
「多層的防御戦略」とその限界
Anthropic は、完璧な耐性が不可能である現状を踏まえ、「多層的防御戦略」を採用しました:
- 影響範囲の縮小: 非万能型ジールブレイクの影響を限定的に抑える。
- コスト増大と監視強化: 万能型ジールブレイクの作成コストを高く設定し、成功した攻撃を迅速に検知・遮断する仕組みを構築。
- データ保持期間の理由: これらの対策に伴い、顧客データの 30 日間の保留期間を義務化した。
現在の脆弱性情報と政府との比較
- 開示された脅威: 現在までに Anthropic に届いた潜在的ジールブレイクは、完全に無害な回答または軽微な発見に限られます。有害な結果をもたらす事例は一切ありませんでした。
- 政府提供情報: 政府から得られたのは、限定的・非万能型のコードベース読み上げに関する情報のみです。
- 他モデルとの比較検証: Anthropic は関連報告書を精査し、政府が示した能力水準は以下の点で既存の技術と同等である可能性が高いことを確認しました:
- OpenAI の GPT-5.5 からも日常的に入手可能。
- システムセキュリティを維持する防御者も常日頃利用している技術。
停止判断の背景と今後の方針
- 判断の根拠: 限定的なジールブレイクの発見をもって、数億人のユーザーが保有する先進モデルを全廃すべき理由は存在しないと判断。
- 業界への影響懸念: 同様の基準を業界全体に適用すれば、新しいモデル展開は事実上全面停止し、技術革新の阻害につながる。
- 政府への提言: 政府に対し、透明性・公平性・明確さ・技術的事実に基づき、法定手続きとして不安定な展開をブロックする能力を持つべきだと考えています(今回の指令はこの原則に沿っていない)。
- 対応姿勢: 今回の混乱に深くお詫び申し上げます。誤解に基づく措置であるとの認識の下、アクセスの復旧に向けた尽力を行います。
今後の予定
- 24 時間以内に、さらなる詳細を共有する予定です。
関連内容
- [Anthropic Public Record]: 初回結果についてさらに詳しく読む
- [Tata Consultancy Services (TCS) との連携]: 5 万人余りの従業員へ Claude を提供し、規制産業向けクラウド・パワー製品開発に参画予定。
- [DXC Technology との連携]: 銀行や航空会社などの規制産業システムへ Claude を統合するグローバル戦略を開始。