クロード・フェブル 5

2026/06/10 1:58

クロード・フェブル 5

RSS: https://news.ycombinator.com/rss

要約

日本語訳:

以下の改善されたバージョンでは、欠落していた安全性の詳細、具体的な価格設定構造、データ保持ポリシー、および可用性のタイムラインを補いながら、明瞭性を維持しています:

まとめ:

Anthropic は、一般使用に安全であり、ソフトウェア工学、可視化解析、長期コンテキスト処理、科学的研究、およびメモリータスクにおいて従来のすべてのバージョンを超えた「Mythos クラス」のモデルである Claude Fable 5 を導入しました。同モデルは直ちに API とサブスクリプションプラン(Pro から Enterprise まで)で利用でき、6 月 22 日まで利用可能です(6 月 23 日からは使用クレジットに移行)。価格は入力トークンあたり 10 ドル、出力トークンあたり 50 ドル で設定されており、Claude Mythos Preview など以前のプレミアムモデルよりも大幅に安価です。

Fable 5 は転換的な性能向上を提供し、以前は何ヶ月もかかった工学タスクを数日へと圧縮するとともに、薬剤設計を約 10 倍加速させます。安全性と有用性のバランスを取りつつ、Fable 5 におけるセンシティブなトピックに関するクエリについては、Claude Opus 4.8 にフォールバックを行う設定となっており、これは保守的なチューニングによりセッションの 約 5% よりも少ない割合 で発生します。さらに、特定の分類器は生物学/化学分野での危険な研究の向上や悪意のあるハッキング試行をブロックします。また、Anthropic は Mythos クラスモデルに対して新しい 30 日間のデータ保持ポリシー を実施し、このトラフィックを新モデルの訓練や安全性以外の目的で使用することを禁止しています。

一般向けの Fable 5 バージョンは依然として非常に安全ですが、未検閲バージョンである Claude Mythos 5 は、15 カ国以上で選択されたサイバーセキュリティおよびインフラストラクチャパートナー(将来的には約 150 の新しい組織へ拡大)を独占的に対象とする Project Glasswing を通じて利用可能です。この戦略的動きは、責任ある使用基準を損なうことなく科学的発見を加速し、重要インフラのセキュリティを強化することを目的としています。プログラムには、将来、特定の生命科学研究者のために生物学/化学の safeguards を解除する計画も含まれています。

本文

クロード・フェーブル 5(Fable 5)とクライド・マイソス 5(Mythos 5)の公開について

本日、Claude Fable 5および限定対象向けのClaude Mythos 5を公開いたします。以下に両モデルの詳細情報、新機能、安全性に関する防護策、および利用方法についてまとめました。

1. モデル概要と主な特徴

Claude Fable 5 (クライド・フェーブル 5)

一般向けリリースの安全な「Mythos クラス 1 モデル」です。これまでのどのモデルよりも優れた性能を持ち、ほぼすべての AI 能力に関するテスト基準で最上位の結果を示しています。特に長期的かつ複雑なタスクにおいて、他のモデルとの差を顕著に広げます。

Claude Mythos 5 (クライド・マイソス 5)

特定の分野で防護策が解除された、Fable 5 と同一の基盤モデルです。

  • 対象者: サイバー防衛者、インフラストラクチャ提供者などの限定小グループ向け。
  • 位置づけ: プロジェクト・グラスウィング(Project Glasswing)を通じて展開され、世界中で最も強力なサイバーセキュリティ能力を備えています。
  • アクセス拡大計画: 信頼されたアクセスペログラムを通じて、今後より広範な利用可能な予定です。

価格設定

  • 入力トークン: 100 万トークンあたり
    $10
  • 出力トークン: 100 万トークンあたり
    $50
  • 特徴: クラウド・マイソス・プレビュー(Claude Mythos Preview)よりも半額以下の価格

2. 主要な性能向上と実績

Fable 5 と Mythos 5 は、過去最高の Claude モデルに比べて自律的に動作する期間が長く、以下のような分野で劇的な改善が見られます。

🛠 ソフトウェア工学

  • 高速開発: ストライプ(Stripe)の報告では、Fable 5 が数月かかるエンジニアリング作業を数日に圧縮。Ruby コードベース 5,000 万行のマイグレーションを通常 2 か月以上かかるところを1 日で完了。
  • トークン効率: Cognition の FrontierCode エバリュエーションにおいて、 frontier モデルの中で最も高いスコアを記録。

🧠 知識作業・分析

  • 財務ベンチマーク: Hebbia の評価で全モデル最高スコア。文書に基づく推論やグラフ/表の解釈が大幅に向上。
  • トレーディング分析: IMC より高い成績で事実確認、概念推論、根本原因分析などで満点に近い結果。

👁 ビジョン処理(画像認識)

  • 科学的抽出: 詳細な科学図表から正確な数値を抽出可能。
  • コード再生成: ウェブアプリのスクリーンショットのみを使ってソースコードを再構築可能。
  • ゲームプレイ: ポケモン・ファイアレッドなど、最小限のスカラー(サポートツール)でもゲーム全体をクリアできる。以前のモデルには必要だった複雑なヘルパーハーネスも不要。

🧬 生命科学と研究開発

  • 薬物設計: 内部タンパク質設計プロセスを約10 倍加速。人間の支援なしで熟練オペレーターの能力を超越する結果。
  • 新たな仮説生成: 一貫して新しい科学的仮説を生み出し、分子生物学分野のブラインド比較において科学者の好みが 80% に達。
  • ゲノム学研究: 『Science』誌に公開されたモデルよりも優れており、サイズが100 倍小さい状態で画期的な研究を自律的に完了(結果は来月発表予定)。

📝 その他の性能評価

  • 記憶機能: 数百万トークン規模の長期タスクでも集中力を維持。「Slayers the Spire」などのデッキ構築ゲームで Opus 4.8 よりも3 倍の性能向上
  • アライメント(整合性): 自動化された評価で、欺瞞行為や不適切な行動レベルは Opus 4.8 と同等。
  • 自律運用: 自己検証機能により、作業を振り返り修正する高度な自律性を発揮。

3. 新しい防護策と安全性(Fable 5 の特性)

Mythos クラスモデルの能力は強力ですが、悪用リスクも高いため、一般利用(Fable 5)向けに慎重に調整された防護スイートを搭載しています。無害なリクエストが誤って検出されるケースもありますが、セッション平均では5% 未満でのトリガーとなっています。

🛡️ 安全性分類器の仕組み

潜在的な悪用(ジャイルブレイク試行を含む)を検知した際、Claude Opus 4.8 に自動的にフォールバックし、Fable 5 の応答を表示しません。

  • フォールバック率: 初期データでは Fable セッションの95% 以上がフォールバックを伴わないことが確認。その場合、Fable 5 と Mythos 5 の性能差は実質的ではありません。

🔒 分類対象分野と対応策

1. サイバーセキュリティ

  • リスク: 脆弱性の発見・悪用、エージェント型ハッキングなど。
  • 対策: Fable が攻撃的なタスク(偵察、横方向移動など)を実行することをブロック。
  • 堅牢性:
    • 1,000 時間に及ぶ外部バグボーンテストで普遍的なジャイルブレイクは見つかりません
    • ハリームのサイバー攻撃計画やエクスプロイト開発に関するクエリで、30 の異なる回避技術を問わずゼロ件のコンプライアンス違反を達成。

2. 生物学と化学

  • リスク: 生物兵器関連、遺伝療法ウイルス(AAV)などの設計能力の悪用。
  • 対策: AAV など的高リスクなリクエストで Opus 4.8 にフォールバック。
  • 将来の拡大: 数週間以内に、信頼されたアクセスペログラムを通じて生物学・化学分野での防護策が一部解除される予定です。

3. 蒸留(Distillation)防止

  • リスク: Fable 5 の能力を悪用して競合モデルの訓練データを生成すること(権威主義的な国での展開など)。
  • 対策: 蒸留試行を検知したリクエストは Opus 4.8 にフォールバック。

📜 データ保持ポリシーの変更

  • 保持期間: Fable 5 および類似モデルのビジネス顧客データについて、第一・サードパーティともに30 日間の保持。
  • 利用制限: 訓練や安全性以外の目的での使用は行いません。人間のアクセス記録と削除スケジュールを明文化しました。
  • 目的: 新しい攻撃手法への防御および誤検知の削減に活用します。

4. クライアントからの早期フィードバック

先行アクセスを受けた顧客による評価です。

カテゴリメインな評価内容
コーディング能力CursorBench で最高スコア。長期的な問題解決に強み。
開発者向け信頼性複雑で長期化するタスクを自律的かつ高信頼性で処理。将来の自動化時代へのステップ。
推論力Opus 4.8 を明らかに上回るシニア研究レベルの判断力と第一原理思考。
意図の理解ユーザーの真の意図を理解し、1 年前は 100 プロンプトだったタスクをワンショットで実行可能に。
自己検証作業を振り返り検証する最高レベルの実装により、高度な自律運用が可能。
物理学研究推論トークン使用量を従来の 3 分の 1 に抑えつつ、GPT-5.5 が 4 日かけた到達点を 36 時間で達成。

5. アクセスキーと展開スケジュール

クロード・フェーブル 5 (Fable 5)

世界中で本日利用可能です。API やエンタープライズプランを通じてアクセスできます。

導入段階とサブスクリプションプランの変更:

  • 本日 ~ 6 月 22 日: Pro、Max、Team、および企業ベースのプランに追加料金なしで含まれます。
  • 6 月 23 日: 上記プランから Fable 5 を除外し、使用にはクレジットが必要になります(容量があれば含み期間を延長します)。
  • 将来的に: 十分な供給が確保されたら、標準的なサブスクリプションプランへの復元を目指します。

クロード・マイソス 5 (Mythos 5)

現在は以下の限定ユーザーのみ利用可能です。

  • グラスウィングパートナー: プロジェクト・グラスウィング参加のサイバーセキュリティ組織など(防護策一部解除)。
  • 生物学研究者: 特定の研究機関のみ(生物学・化学防護策解放、サイバー防護策有効)。
  • 米国政府: 協力の枠組み下でのアクセス拡大。

信頼されたアクセスペログラムを通じて、これら限定グループへのアクセス範囲が今後順次拡大されます。

同じ日のほかのニュース

一覧に戻る →

2026/06/10 6:01

NPM バージョン 12 で導入される予定のbreaking changes

## Japanese Translation: npm v12 開始(推定リリースは 2026 年 7 月)、`npm install` に対してより厳格なセキュリティデフォルトが適用されます。最も重要な変更は、自動スクリプト実行の無効化です(`allowScripts` がデフォルトでオフ)。明示的に承認されないと、preinstall、install、postinstall スクリプト(`node-gyp` を介するネイティブビルドを含む)がブロックされます。準備のためには、これらの変更を警告付きで利用可能な npm v11.16.0+(またはそれ以降)を使用してください:`npm approve-scripts --allow-scripts-pending` を実行し、信頼できるパッケージについては `npm approve-scripts` で明示的に承認し、他は `npm deny-scripts` で拒否します。結果となる許可リストは `package.json` に書き込まれコミットすべきであり、v12 へのアップグレード後は承認されたスクリプトのみが実行されます。 さらに、デフォルトでは `--allow-git`(npm 11.10.0+ で利用可能)は none に解決され、Git ベースの依存関係に対して明示的なフラグが必要となり、`.npmrc` オーバーライドを介した潜在的なコード実行経路を閉じます。同様に、`--allow-remote`(npm 11.15.0+ で利用可能)はリモート URL から依存関係を解決する場合にデフォルトで none に設定されます。`--allow-file` および `--allow-directory` は現在のデフォルトを維持します。保守担当者および CI/CD パイプラインは依存関係を検証し、`package.json` 内の許可リストを更新し、アップグレード前に変更をコミットする必要があります。そうでない場合、手動の例外を設定しない限りビルド失敗となります。詳細は npm ドキュメントの `npm approve-scripts`、`npm deny-scripts`、および `allow-scripts config` をご参照ください。

2026/06/10 4:21

FPGA を用いたKolmogorov-Arnold Networkによる超高速機械学習

## Japanese Translation: 本テキストは、Kolmogorov-Arnold Network(KAN)を Field-Programmable Gate Array(FPGA)上で展開し、超高速機械学習に特化して設計された革命的な新ハードウェアアーキテクチャを導入します。従来の GPU はスケジューリング遅延およびメモリオーバーヘッドによりマイクロ秒以下の応答時間を達成できず苦労しますが、この FPGA ベースのアプローチでは、ニューラルネットワークをリプログラミング可能なデジタルロジックと直接統合するため、アルゴリズムと設計のコデザインを採用しています。固定された重みではなく、B スプライン基底関数によって定義される学習可能なエッジアクティベーションに置き換えることで、伝統的なルックアップテーブルモデルに見られるような指数関数的スケーリングの問題を回避します。この手法は、定点符号化によるデータエンコーディングの簡素化を実現し、トレーニングの安定性を確保します。主な革新点は、「B スプラインの局所性」の利用であり、グリッドセルごとにアクティブとなる基底関数の数が限られているため、ネットワークの次数を増やすことなくグリッドサイズを拡大することでモデルを水平方向にスケール可能になります。得られる枠組みは「KANELÉ」と命名され、従来の実装に対する驚異的な 2,700 倍もの速度向上を達成し、オンデバイスでの動的モデル更新が可能となる真のオンライン学習を実現します。この画期的な成果は、量子コンピューティング制御システムなどリアルタイム意思決定が必要な産業に対し、高効率性と継続的改善を支援する GPU の代替として堅牢な選択肢を提供します。大規模テストにおいて、同システムは関数近似やキュビット読み出しなどのタスクで伝統的な MLP よりも優れたハードウェアスケーリングと収束性を示し、50,000 パラメータまで扱いながらマイクロ秒以下のレイテンシを維持しました。

2026/06/09 19:46

1993 のグラフィックを作るかのように

## 日本語訳: **サマリー:** Catlantean 3D は、1 年間の余暇に 걸쳐情熱的に開発されたプロジェクトであり、2027 年初頭における公式な Steam リリースを目指しています。古代エジプトのサイバーパンクパロディである Catlantis を舞台とし、厳格な技術的制約の下でレトロな魅力と現代の革新性を融合させています。 視覚的には、プリレンダリングされた Blender モデルと手描きの Aseprite スプライトを組み合わせ、ハイトマップ、ノイズ、汚れを用いた手続き生成テクスチャ(procedurally generated textures)や、Voronoi 分解および物理シミュレーションを利用した複雑な手続き的なデスマニペーション(complex procedural death animations)を実装しています。DDA アルゴリズムを使用したカスタム実装のレイカッストリングエンジン上で動作し、320x240 の解像度と 256 カラーによりスクエアピクセルを確保しています。主要な技術的達成事項としては、浮動小数点精度と組み合わせた決定論的なレンダリングロジックが挙げられます。エンジンは、Olabk(※原文「Oklab」の誤記と考えられるため)距離を利用した革新的なパレット管理システムを搭載し、色認識の正確さを保証するとともに、 colormap ルックアップテーブルを使用した動的照明アルゴリズムを採用し、ループ処理なしで O(1) パフォーマンスを実現しています。 本プロジェクトには、高度な照明機能やフラグペイントイングを支援するカスタム Python ベースのマップエディタ(wxPython/pybind)が含まれています。最終製品は設定不要であることがありながら、5 ドルから 8 ドルの価格帯で提供され、コンパイル済みバイナリアーカイブとして配布されます。コミュニティ精神に倣い、開発者は GitHub 上で全体のコードベースを開源化することを計画しており、レイカッストリングエンジンや手続き的なコンテンツ生成を調査する愛好家に貴重な洞察を提供します。