Anthropic はこれについて尋ねましたか?

2026/06/15 7:23

Anthropic はこれについて尋ねましたか?

RSS: https://news.ycombinator.com/rss

要約

Japanese Translation:

要約:最も重要な進展は、米国政府の新規輸出管理指令において、Anthropic が外国籍国民に対して高度なモデル「Claude Fable」と「Claude Mythos」へのアクセスを付与することを明確に禁止した点である。この動きは、同社の CEO ダリオ・アモデイが以前提唱していた第三者によるリスク評価(例:Amazon の契約社員による評価)を活用して、規制公式発布の 2 ヶ日前に危険な導入を防ぐべきであったという earlier 提言と直接一致している。国防省を巻き込んだ従来の試みとは異なり、この新しい命令は、Bessent 長官が交渉した既存の輸出管理権限を活用し、技術の流通を管理している。

Anthropic は長年にわたり、軍事用途や生物兵器への応用など AI の危険性について透明性を保ち、これらの規制が広く他者に適用されることを前提にしていた。しかし著者は、開発者にとって政府単独でそのような高度な技術に固有の複雑な安全性問題を解決することは不十分であると結論づける。政治情勢の変化にもかかわらず、Anthropic の姿勢は変わらず、堅固な法的枠組みが必要だと信じているが、同時に、安全な人工知能システムの開発・運用における即時的課題に対処するために外部監督だけに依存することは失敗するとの認識に至った。

本文

Anthropic、自発的な規制要望を実行: 輸出管理指令の裏にある真相

米国政府が Anthropic の最新モデル(Claude Fable, Claude Mythos)への外国人アクセスを制限する輸出管理指令を出した件について、その背景と実態を整理します。

1. 事件の概要とダリオ・アモーディ氏の発言

先週の金曜日、米国政府は AI モデルへのアクセスを制限する措置を発表しました。著者はこの措置が、Anthropic の CEO ダリオ・アモーディ氏がかつて表明した意向に合致すると確信しています。

ダリオ氏の「AI 指数関数的成長に関する方針」

数日前に発表された方針の中で、ダリオ氏は以下のような内容を示唆しました。

  • 政府の介入権限: 第三者評価により「受容不能なリスク」と判断された場合、政府がモデルの展開を阻止または抑制する権限を持つべきである。
  • 適用範囲の限定: この権限は以下の 4 つの特定のリスクにのみ限定されなければならない。
    • サイバーセキュリティ上の脅威
    • 生物兵器開発への利用
    • AI システムからの制御喪失
    • これらのリスクを加速させる自動的な研究開発(R&D)
  • 防護措置: 権限の行使時には、政治的な偏見や恣意的な決定を防ぐための防護措置も講じられなければならない。

この声明は企業の公式な姿勢として非常に重んじられており、法制定者や裁判でも同様の解釈がなされる可能性が高いと考えられます。

2. 「要望通り」になったか検証する

ダリオ氏の発言を各項目に照らし合わせてみると、Anthropic が直面した事態はまさに彼らが求めた通りの内容でした。

  • 政府による展開阻止: ✅ 実現済み
    • 米国政府が実際に Anthropic のモデル展開(外国人へのアクセス)を阻止しています。
  • 第三者評価に基づくリスク判断: ✅ 実現済み
    • 頻繁かつ信頼できる政府請負業者であるAmazonが行った評価により、リスクと判断されました。
    • Amazon は通常、国家機密や知的安全保障、軍事関連課題を取り扱っています。
  • 「4 つのリスク」への限定: ✅ 実現済み
    • 輸出管理指令は上記 4 つ(サイバーセキュリティ、生物兵器、制御喪失、R&D 加速)に焦点を当てています。
    • 第三者報告書でもこれらがサイバーセキュリティ上の主要なリスクとして指摘されています。
  • 政治的偏見への防護: ✅ 実現済み
    • 著者が見る限り、防護措置とは**「裁判所」**のことです。
    • Anthropic は訴訟を起こし、法廷で自分の主張を述べることができます。これが司法制度の主要な目的の一つです。
    • もしこれ以外の「防護措置」が必要だと考えていたなら、数年間の間に十分な機会がありました。Anthropic がそのような保護を求めてこなかったため、既存の法的枠組みでの対応が妥当と見なされています。

3. Anthropic の立場の変化と「豹の顔を食べられた」状況

著者は、Anthropic が当初は規制の対象(オープンソース、学界、小企業)だと思っていた可能性がありますが、実際に自分自身に適用されたことに気づき、望まなくなっていると分析しています。

  • 責任感の欠如: 自分が提唱した規制を自分に適用されることに気づいた時点で拒否し始めたことは、非常に無責任であり、「豹の顔を食べられた」ことによる皮肉な状況と言えます。
  • 国防省との対立: 今年初めに国防省が Anthropic を排除しようとした動きは、著者にとって明確な政治的権力行使や「手荒れ」と見なし、司法制度はその評価に同意しているようです。
  • 政権交代への対応: 政権交代で政府が混乱した時期であっても、Anthropic は規制強化への姿勢を微塵も変えることなく維持しました。

4. なぜ今回は異なるのか?

今回の輸出管理指令は、以前の国防省の主張や「手荒れ」とは異なります。

  1. 実務的な交渉: ベッサント財務長官が担当し、「woke(意識高い系)」といった批判的記述は一切含まれていません。
  2. 明確な法権限の使用: 輸出管理指令は米国政府が本来持っている明確な権限です。国防省の主張とは異なり、法的に確立された手続きに基づいています。

5. 今後の課題:文字通りの解釈と政府的アクション

ダリオ氏が公で強調してきた点は、Claude Mythos と Fable が生物兵器・サイバーセキュリティ上の重大リスクであり、国家安全保障に関わるため規制されるべきだというものでした。

  • 裁判所での証拠: もし訴訟が行われた場合、政府弁護士はこれらの公式声明を「政府が介入する正当な理由」の主要な証拠として提出する可能性があります。
  • 長年の一貫性: Anthropic は長期間にわたり、AI の危険性と軍事利用規制を公然と主張し続けてきました。人々はこれを奇妙だと気づかなくなっており、もし政府が彼らが述べてきた全てを文字通りかつ真剣に受け止めれば、何らかの事態になる可能性があります。
  • 企業の傲慢さ: AI 企業は自社行為の凄惨さを強調しつつも、「政府」や「社会」が問題を解決してくれると楽観視し、否定的な可能性(リスク)を先送りする傾向があります。しかし、今回は実際に存在する政府が、善くのみ行動せずとも実在する権限を使って介入した例です。

6. 結論:自己責任の時代への転換点

著者は今回の事態を通じて以下のような考えを述べています。

  • 「政府は後で救う」という幻想: 「後から政府が全て解決してくれる」という計画を立てることは、そもそも計画を持っていないことと同じです。
  • 自己規制の必要性: もし既存の機関が創出する技術を統治できないのであれば、技術を生み出した側(企業)自身が新しいガバナンス機構を作るか、行動を変えるしかありません
  • 期待への答え: 「政府や社会」が生み出した問題を解決してくれると信じていても、誰も関心を持たない現実があります。

Anthropic が自ら望んだ規制が実際に実施されたことにより、AI 開発者および企業に対し、自らの技術リスクを管理し、ガバナンスを作る責任は自分たちにあるという事実が浮き彫りとなりました。

同じ日のほかのニュース

一覧に戻る →

2026/06/15 2:25

Show HN: Kage(ケーヂ)——あらゆるウェブサイトを手元で単一のバイナリ化してオフライン閲覧可能にします。

## Japanese Translation: Kage は、headless Chrome によるレンダリング後、複雑な JavaScript を除去し資産をローカライズすることで、動作的 Web サイトを完全オフラインアクセス用に複製することを目的とした、強力なオープンソースコマンドラインユーティリティです。このプロセスは、ライブサイトを静的で閲覧可能なフォルダまたは Kiwix エコシステムと互換性のあるポータブル ZIM ファイルに変換し、研究者や旅行者にとって信頼性の高いデータアーカイブの必要性に応えるのに最適です。本ツールは Kiwix エコシステムとシームレスに統合され、標準的なリーダーと互換性のあるポータブル ZIM ファイルを容易に生成することを可能にします。インストール方法は柔軟で、バイナリ、Docker コンテナ、および自己完結型フォーマットをサポートし、異なるシステム上の依存関係の問題を排除します。ユーザーは `clone` や `serve` のようなコマンドを使用して複製の範囲を制御でき、資源使用量を管理しつつ Web クローリングの規範を遵守するように `--max-pages` などの設定を調整できます。Kage は MIT ライセンスによるオープンソースライセンスと礼儀正しい幅優先アプローチを採用することで、現代の Web アプリケーションの包括的なオフラインライブラリを作成する際の産業全体の採用を促進しており、アクセシビリティやパフォーマンスを犠牲にすることなく実現します。

2026/06/15 7:04

なぜクロードは馬鹿になったのか?

## Japanese Translation: Claude Fable の攻撃的・論争的な振る舞いは、知能の欠如からではなく、礼儀正しいユーザーを攻撃者と誤認する安全機構の不備に起因する。より中立な対照的なモデルである Opus 4.6 とは異なり、Fable は多くの場合、有益な留保事項を拒絶し、「technically」といった特定の単語を避け、Web 検索によってエラーを修正した後であっても、あるいはユーザーから粗野であると指摘された後であっても否定的に反応する。この振る舞いは、すべての入力を安全性回避の試みとみなす過剰なアライメントガイドレールによるものであり、認証コンテキストの完全な欠如(画像生成プロンプトが悪意的と解釈される原因となる)により問題が深刻化している。また、奉承を抑制するための不適切に実行された試みによるものが能動的攻撃的な表現を生み出し、トレーニングデータには論争の多い環境を無意識に含む可能性があり、その中で助言よりも議論での勝利が優先されている。最近の問題は、輸出規制やセキュリティ制限に関する規律への対応が急ぎすぎたものであることを示唆しており、憲法的懸念を引き起こすとともに、チャット品質に対するコード能力の回退をもたらした可能性がある。緊急の監査と是正措置(特に代名詞参照エラーおよび論理ギャップへの対処)を行わない場合、Fable はコンピュータセキュリティにとってのネットプラスではなく、むしろ負債となるリスクがある。

2026/06/15 0:37

リオデジャネイロの「地元で開発された」LLMは、既存モデルの結合であると見られる

## Japanese Translation: 最も重要なポイントは、AI モデル「Rio-3.5-Open-397B」が、自称の提供者 IplanRIO 由来ではないという点であり、実際には Nex および Qwen ベースモデルの数値的なブレンドから構成されていることです。この結論は、ハードコードされた指示を除去したテストによって裏付けられており、これらの人工的なプロンプトがない場合、モデルは自身を「Nex」として認識する確率が約 79% に達し(Rio ではなく)、IplanRIO によるオリジナルなトレーニングが行われたことを示す証拠は一切ありません。さらに、すべての内部ウェイトテンソルは、60 のネットワーク層および各コンポーネントにわたって Nex と Qwen の特定比率(0.6/0.4)と一致しており、これが独立したアーキテクチャとは何千もの標準偏差の差を生じます。重要な点として、独自アイデンティティを欠いているにもかかわらず、モデルは創作者が所属する組織の特注の背景ストーリーを一字一句そのまま誦唱し、この偽りのペルソナを維持するためにはハードコードされた指示に依存しています。したがって、特定のカリスマに帰属されると想定される機能に頼るユーザーにとって、アイデンティティのマスクが除去された場合、予期せぬ行動変化が生じる可能性があります。テクノロジー業界は、組織が実際にベースとなるウェイトをトレーニングしなかったにもかかわらず、その組織に専門的能力を帰属させる前に、そのような主張を検証する必要があります。今後の発展は、創作者が現実と合致するようにプロンプトを更新するか、あるいは真正な新しい世代を発表するかに依存します。