
2026/02/06 2:38
クラウド・オーパス 4.6 (Claude Opus 4.6)
RSS: https://news.ycombinator.com/rss
要約▶
Japanese Translation:
改善された要約
Claude Opus 4.6 は ベータ版 1 M‑トークンコンテキストウィンドウ を備えてリリースされ、最大で 128 k トークン を出力できます。GDPval‑AA においては GPT‑5.2 より約 144 Elo の優位を示し、前モデルよりも 190 Elo ポイント で上回っています。金融・法務・その他の高価値タスクで卓越した性能を発揮しています。Terminal‑Bench 2.0 ではすべてのフロンティアモデルを凌駕し、Humanity’s Last Exam と BrowseComp においても同様です。サイバーセキュリティ分野では Opus 4.6 が Claude 4.5 を対象とした9つのサブエージェントと100件を超えるツール呼び出しで、38/40 の盲検ランキング で勝利しています。長期コンテキスト性能は MRCR v2 の 1 M‑トークンニードルインハイスタックベンチマークで 76 % を達成し、Sonnet 4.5 の 18.5 % を大幅に上回っています。安全性監査では最近の Claude リリース中で最も低い過剰拒否率を示し、整合性の欠如した行動が増加している兆候はありません。
新しい API 機能には 適応的思考、4 つの努力レベル(低〜最大)、コンテキスト圧縮(ベータ) が含まれ、拡張されたコンテキスト機能も提供されます。製品更新では Claude Code におけるエージェントチーム、長時間にわたるマルチステップ変更のための強化された Excel 統合、ブランド一貫性を保つレイアウト/フォント読み取り機能を備えた PowerPoint 研究プレビューが追加されました。モデルの計画とサブエージェント調整により、複雑なコーディングタスクや法的推論(BigLaw Bench スコア 90.2 %)が可能になり、以前のモデルと比べて大規模コードベース移行を半分に短縮します。価格は標準使用で 1M トークンあたり 5 USD / 25 USD のままで、200k トークン以上の入力/出力の場合はプレミアムレート(10 USD / 37.50 USD)が適用されます。Opus 4.6 は claude.ai、Claude API、および主要クラウドプラットフォーム(AWS、GCP、Azure) で今日から利用可能です。すべての安全性と能力評価は Claude Opus 4.6 システムカード に記載されています。
本文
私たちは最も知能的なモデルをアップグレードしています。
新しい Claude Opus 4.6 は、前世代のコーディングスキルをさらに向上させています。
- より慎重に計画し、エージェントタスクを長時間維持できるようになり、大規模コードベースでもより安定して動作します。
- コードレビューとデバッグ能力が向上し、自身のミスも検出できます。
- 1 Mトークン(テスト版)のコンテキストウィンドウを備えています。
Opus 4.6 は、日常業務にもその優れた機能を適用します。財務分析、リサーチ、ドキュメント・スプレッドシート・プレゼンテーションの作成など、Claude が自律的にマルチタスクできる Cowork 内で、すべてのスキルがあなたの代わりに活用されます。
パフォーマンスハイライト
- Terminal‑Bench 2.0 で最高点を取得したエージェント型コーディング評価。
- Humanity’s Last Exam(多分野推論)で他のフロンティアモデルをリード。
- GDPval‑AA(財務・法務等)では GPT‑5.2 を約144 Elo、Claude Opus 4.5 を190ポイント上回ります。
- BrowseComp で最も優れた性能を示し、難しいオンライン情報の検索が可能です。
- 他のフロンティアモデルと同等かそれ以上の安全プロファイルを維持しています。
新機能
| 機能 | 説明 |
|---|---|
| Claude Code Agent Teams | 複数のエージェントを並列で起動し、自己調整で協働します。 |
| Context Compaction (beta) | 会話が設定可能な閾値に近づくと古いコンテキストを要約し、長時間タスクでも制限に達しません。 |
| Adaptive Thinking | モデル自身がより深い推論が有効か判断し、開発者は努力レベルを調整できます。 |
| Effort Levels | 低・中・高(デフォルト)・最大の4段階。 |
| 1 M Token Context Window | 1 Mトークンコンテキストを持つ初の Opus‑クラスモデル(200kトークン超はプレミアム価格)。 |
| 128k Output Tokens | 最大128kトークンまで出力でき、複数リクエストに分割されません。 |
| US‑Only Inference | 米国でのみ実行が必要なワークロードに対し 1.1× トークン価格で利用可能。 |
製品・APIアップデート
- Claude in Excel – 長時間かつ難易度の高いタスクで性能向上、事前計画と非構造化データから構造を推論。
- Claude in PowerPoint(リサーチプレビュー) – Excel のデータを処理・構造化し、ブランドに沿った視覚的プレゼンテーションへ変換。
安全性・整合性
- 誤情報や奉仕行動の発生率が低い。
- 最新 Claude モデルで最も低い過剰拒否率を実現。
- ユーザー福祉、危険リクエスト拒否、潜在的有害行動への包括的安全評価を実施。
- 6 つの新しいサイバーセキュリティプローブで悪用検知能力を強化。
利用可否・価格
- claude.ai、API、および主要クラウドプラットフォームで今日から利用可能。
- Claude API で claude‑opus‑4‑6 を使用。
料金:$5 / $25/百万トークン(従来と同価格)。
200k トークン超のプロンプトにはプレミアム価格($10 / $37.50/百万入力/出力トークン)。
要約すると: Claude Opus 4.6 は、これまでで最も強力なモデルです。コーディング・推論・長期コンテキスト性能が優れ、安全性はトップクラス。ソフトウェア開発から財務・法務分析、サイバーセキュリティ、デザインシステムに至るまで、複雑なタスクを解決する準備ができています。