
2026/06/10 1:58
クロード・フェブル 5
RSS: https://news.ycombinator.com/rss
要約▶
日本語訳:
以下の改善されたバージョンでは、欠落していた安全性の詳細、具体的な価格設定構造、データ保持ポリシー、および可用性のタイムラインを補いながら、明瞭性を維持しています:
まとめ:
Anthropic は、一般使用に安全であり、ソフトウェア工学、可視化解析、長期コンテキスト処理、科学的研究、およびメモリータスクにおいて従来のすべてのバージョンを超えた「Mythos クラス」のモデルである Claude Fable 5 を導入しました。同モデルは直ちに API とサブスクリプションプラン(Pro から Enterprise まで)で利用でき、6 月 22 日まで利用可能です(6 月 23 日からは使用クレジットに移行)。価格は入力トークンあたり 10 ドル、出力トークンあたり 50 ドル で設定されており、Claude Mythos Preview など以前のプレミアムモデルよりも大幅に安価です。
Fable 5 は転換的な性能向上を提供し、以前は何ヶ月もかかった工学タスクを数日へと圧縮するとともに、薬剤設計を約 10 倍加速させます。安全性と有用性のバランスを取りつつ、Fable 5 におけるセンシティブなトピックに関するクエリについては、Claude Opus 4.8 にフォールバックを行う設定となっており、これは保守的なチューニングによりセッションの 約 5% よりも少ない割合 で発生します。さらに、特定の分類器は生物学/化学分野での危険な研究の向上や悪意のあるハッキング試行をブロックします。また、Anthropic は Mythos クラスモデルに対して新しい 30 日間のデータ保持ポリシー を実施し、このトラフィックを新モデルの訓練や安全性以外の目的で使用することを禁止しています。
一般向けの Fable 5 バージョンは依然として非常に安全ですが、未検閲バージョンである Claude Mythos 5 は、15 カ国以上で選択されたサイバーセキュリティおよびインフラストラクチャパートナー(将来的には約 150 の新しい組織へ拡大)を独占的に対象とする Project Glasswing を通じて利用可能です。この戦略的動きは、責任ある使用基準を損なうことなく科学的発見を加速し、重要インフラのセキュリティを強化することを目的としています。プログラムには、将来、特定の生命科学研究者のために生物学/化学の safeguards を解除する計画も含まれています。
本文
クロード・フェーブル 5(Fable 5)とクライド・マイソス 5(Mythos 5)の公開について
本日、Claude Fable 5および限定対象向けのClaude Mythos 5を公開いたします。以下に両モデルの詳細情報、新機能、安全性に関する防護策、および利用方法についてまとめました。
1. モデル概要と主な特徴
Claude Fable 5 (クライド・フェーブル 5)
一般向けリリースの安全な「Mythos クラス 1 モデル」です。これまでのどのモデルよりも優れた性能を持ち、ほぼすべての AI 能力に関するテスト基準で最上位の結果を示しています。特に長期的かつ複雑なタスクにおいて、他のモデルとの差を顕著に広げます。
Claude Mythos 5 (クライド・マイソス 5)
特定の分野で防護策が解除された、Fable 5 と同一の基盤モデルです。
- 対象者: サイバー防衛者、インフラストラクチャ提供者などの限定小グループ向け。
- 位置づけ: プロジェクト・グラスウィング(Project Glasswing)を通じて展開され、世界中で最も強力なサイバーセキュリティ能力を備えています。
- アクセス拡大計画: 信頼されたアクセスペログラムを通じて、今後より広範な利用可能な予定です。
価格設定
- 入力トークン: 100 万トークンあたり
$10 - 出力トークン: 100 万トークンあたり
$50 - 特徴: クラウド・マイソス・プレビュー(Claude Mythos Preview)よりも半額以下の価格。
2. 主要な性能向上と実績
Fable 5 と Mythos 5 は、過去最高の Claude モデルに比べて自律的に動作する期間が長く、以下のような分野で劇的な改善が見られます。
🛠 ソフトウェア工学
- 高速開発: ストライプ(Stripe)の報告では、Fable 5 が数月かかるエンジニアリング作業を数日に圧縮。Ruby コードベース 5,000 万行のマイグレーションを通常 2 か月以上かかるところを1 日で完了。
- トークン効率: Cognition の FrontierCode エバリュエーションにおいて、 frontier モデルの中で最も高いスコアを記録。
🧠 知識作業・分析
- 財務ベンチマーク: Hebbia の評価で全モデル最高スコア。文書に基づく推論やグラフ/表の解釈が大幅に向上。
- トレーディング分析: IMC より高い成績で事実確認、概念推論、根本原因分析などで満点に近い結果。
👁 ビジョン処理(画像認識)
- 科学的抽出: 詳細な科学図表から正確な数値を抽出可能。
- コード再生成: ウェブアプリのスクリーンショットのみを使ってソースコードを再構築可能。
- ゲームプレイ: ポケモン・ファイアレッドなど、最小限のスカラー(サポートツール)でもゲーム全体をクリアできる。以前のモデルには必要だった複雑なヘルパーハーネスも不要。
🧬 生命科学と研究開発
- 薬物設計: 内部タンパク質設計プロセスを約10 倍加速。人間の支援なしで熟練オペレーターの能力を超越する結果。
- 新たな仮説生成: 一貫して新しい科学的仮説を生み出し、分子生物学分野のブラインド比較において科学者の好みが 80% に達。
- ゲノム学研究: 『Science』誌に公開されたモデルよりも優れており、サイズが100 倍小さい状態で画期的な研究を自律的に完了(結果は来月発表予定)。
📝 その他の性能評価
- 記憶機能: 数百万トークン規模の長期タスクでも集中力を維持。「Slayers the Spire」などのデッキ構築ゲームで Opus 4.8 よりも3 倍の性能向上。
- アライメント(整合性): 自動化された評価で、欺瞞行為や不適切な行動レベルは Opus 4.8 と同等。
- 自律運用: 自己検証機能により、作業を振り返り修正する高度な自律性を発揮。
3. 新しい防護策と安全性(Fable 5 の特性)
Mythos クラスモデルの能力は強力ですが、悪用リスクも高いため、一般利用(Fable 5)向けに慎重に調整された防護スイートを搭載しています。無害なリクエストが誤って検出されるケースもありますが、セッション平均では5% 未満でのトリガーとなっています。
🛡️ 安全性分類器の仕組み
潜在的な悪用(ジャイルブレイク試行を含む)を検知した際、Claude Opus 4.8 に自動的にフォールバックし、Fable 5 の応答を表示しません。
- フォールバック率: 初期データでは Fable セッションの95% 以上がフォールバックを伴わないことが確認。その場合、Fable 5 と Mythos 5 の性能差は実質的ではありません。
🔒 分類対象分野と対応策
1. サイバーセキュリティ
- リスク: 脆弱性の発見・悪用、エージェント型ハッキングなど。
- 対策: Fable が攻撃的なタスク(偵察、横方向移動など)を実行することをブロック。
- 堅牢性:
- 1,000 時間に及ぶ外部バグボーンテストで普遍的なジャイルブレイクは見つかりません。
- ハリームのサイバー攻撃計画やエクスプロイト開発に関するクエリで、30 の異なる回避技術を問わずゼロ件のコンプライアンス違反を達成。
2. 生物学と化学
- リスク: 生物兵器関連、遺伝療法ウイルス(AAV)などの設計能力の悪用。
- 対策: AAV など的高リスクなリクエストで Opus 4.8 にフォールバック。
- 将来の拡大: 数週間以内に、信頼されたアクセスペログラムを通じて生物学・化学分野での防護策が一部解除される予定です。
3. 蒸留(Distillation)防止
- リスク: Fable 5 の能力を悪用して競合モデルの訓練データを生成すること(権威主義的な国での展開など)。
- 対策: 蒸留試行を検知したリクエストは Opus 4.8 にフォールバック。
📜 データ保持ポリシーの変更
- 保持期間: Fable 5 および類似モデルのビジネス顧客データについて、第一・サードパーティともに30 日間の保持。
- 利用制限: 訓練や安全性以外の目的での使用は行いません。人間のアクセス記録と削除スケジュールを明文化しました。
- 目的: 新しい攻撃手法への防御および誤検知の削減に活用します。
4. クライアントからの早期フィードバック
先行アクセスを受けた顧客による評価です。
| カテゴリ | メインな評価内容 |
|---|---|
| コーディング能力 | CursorBench で最高スコア。長期的な問題解決に強み。 |
| 開発者向け信頼性 | 複雑で長期化するタスクを自律的かつ高信頼性で処理。将来の自動化時代へのステップ。 |
| 推論力 | Opus 4.8 を明らかに上回るシニア研究レベルの判断力と第一原理思考。 |
| 意図の理解 | ユーザーの真の意図を理解し、1 年前は 100 プロンプトだったタスクをワンショットで実行可能に。 |
| 自己検証 | 作業を振り返り検証する最高レベルの実装により、高度な自律運用が可能。 |
| 物理学研究 | 推論トークン使用量を従来の 3 分の 1 に抑えつつ、GPT-5.5 が 4 日かけた到達点を 36 時間で達成。 |
5. アクセスキーと展開スケジュール
クロード・フェーブル 5 (Fable 5)
世界中で本日利用可能です。API やエンタープライズプランを通じてアクセスできます。
導入段階とサブスクリプションプランの変更:
- 本日 ~ 6 月 22 日: Pro、Max、Team、および企業ベースのプランに追加料金なしで含まれます。
- 6 月 23 日: 上記プランから Fable 5 を除外し、使用にはクレジットが必要になります(容量があれば含み期間を延長します)。
- 将来的に: 十分な供給が確保されたら、標準的なサブスクリプションプランへの復元を目指します。
クロード・マイソス 5 (Mythos 5)
現在は以下の限定ユーザーのみ利用可能です。
- グラスウィングパートナー: プロジェクト・グラスウィング参加のサイバーセキュリティ組織など(防護策一部解除)。
- 生物学研究者: 特定の研究機関のみ(生物学・化学防護策解放、サイバー防護策有効)。
- 米国政府: 協力の枠組み下でのアクセス拡大。
信頼されたアクセスペログラムを通じて、これら限定グループへのアクセス範囲が今後順次拡大されます。