
2026/02/18 2:48
**Claude Sonnet 4.6**(クロード・ソネット 4.6)
RSS: https://news.ycombinator.com/rss
要約▶
Japanese Translation:
Claude Sonnet 4.6 は Anthropic の最新かつ最も優れた Sonnet モデルで、現在すべての Claude プラン(Free と Pro)でデフォルトとなっています。価格は Sonnet 4.5 と同じままで、1 兆トークンあたり $3 / $15 です。このモデルは 1,000,000 トークンのコンテキストウィンドウ(ベータ版)、適応/拡張思考、コンテキスト圧縮、自動ウェブ検索フィルタリング、拡張ツール例、および Excel の MCP コネクタサポートを導入しています。
初期ユーザーは、Sonnet 4.5 に対してコードの正確性、一貫性、指示追従、全体的なパフォーマンスで大幅に優れていると報告しています。特に Opus 4.5 を約 70%(59%)上回る性能を発揮しています。OSWorld、Vending‑Bench Arena、OfficeQA、Financial Services Benchmark、保険ワークフローなどのベンチマークでは、複雑なスプレッドシートや多段階ウェブフォームでほぼ人間レベルの結果が得られ、Sonnet 4.6 は Opus 4.6 と同等またはそれに近い性能を示しつつ、コストも低く抑えられています。安全性評価では大きな不整合問題は確認されず、プロンプトインジェクション耐性は Opus 4.6 と同等です。
製品アップデートには、フロントエンド設計とコード修正の改善(例:楽天 AI 用の最高 iOS コード)や保険ベンチマークで 94% の精度率が含まれます。Claude Code、API、および主要クラウドプラットフォーム全体で拡張された可用性により、Sonnet 4.6 はスプレッドシート自動化、保険ワークフロー、複雑なウェブ操作などのタスクにおいて、コード精度の向上、安全な対話、および低い導入コストを提供し、多くの産業で生産性ツールを再構築する可能性があります。
本文
Claude Sonnet 4.6 – 概要
-
モデルの機能
- コーディング、コンピュータ利用、長文推論、エージェント計画、知識作業、設計スキルを含む全般的なアップグレード。
- 1 Mトークン(ベータ版)のコンテキストウィンドウ。
- claude.ai および Claude Cowork の無料・Proプランでデフォルトモデルとして採用;価格は Sonnet 4.5 と同じ($3/15 万トークン)。
-
性能のハイライト
- コーディングの一貫性、指示追従、およびユーザー嗜好に関して Sonnet 4.5、さらには2025年11月リリースの Opus 4.5 を上回る。
- 多くのオフィスタスクで Opus クラスの性能を低コストで実現。
- 安全性も高い:暖かく正直、親社会的で、安全行動が強化されており、大きな不整合は報告されていない。
-
コンピュータ利用
- 初の汎用コンピュータ利用モデル(2024年10月公開)。
- OSWorld ベンチマークを使用し、API を介さずに Chrome、LibreOffice、VS Code 等実際のソフトウェアと対話する能力を評価。
- 16か月にわたり継続的な向上;初期ユーザーは複雑なスプレッドシートやマルチタブワークフローで人間レベルに近い性能を報告。
- 上位の人間専門家にはまだ劣るが、進歩は速い。
-
安全性・プロンプトインジェクション
- Sonnet 4.5 と比較してプロンプトインジェクションへの耐性が強化され、Opus 4.6 と同等。
- API ドキュメントに詳細な緩和ガイダンスが記載。
-
ベンチマークとユースケース
- コード:ユーザーは約70%の確率で Sonnet 4.6 を Sonnet 4.5 より好む;Opus 4.5 に対しても59%好まれる。
- Vending‑Bench Arena:初期投資を早め、後に収益性へ転換する戦略で Sonnet 4.5 を上回る。
- OfficeQA & Financial Services Benchmark:Opus 4.6 と同等の性能;回答一致率とリコールが大幅向上。
- 保険ベンチマーク:コンピュータ利用タスク(提出受付、初回損失通知)で94%の正確性を達成。
- アプリ構築・バグ修正:複雑なビルドや iOS コード生成(楽天 AI の例)においてフロンティアレベルの結果。
- デザイン・フロントエンド:ページとレポート作成に完璧な感覚を持ち、最小限のサポートで実行可能。
-
プロダクトアップデート
- Developer Platform:適応型思考、拡張思考、およびベータ版コンテキスト圧縮をサポート。
- API:Web検索/フェッチツールが自動でコードを書き実行し、結果をフィルタリング;ツール使用例も拡充。
- Excel アドイン:S&P Global、LSEG、Daloopa、PitchBook、Moody’s、FactSet の MCP コネクターにより、Excel を離れずにコンテキスト取得が可能(Pro、Max、Team、Enterprise)。
-
利用可否
- すべての Claude プラン、Claude Cowork、Claude Code、API、および主要クラウドプラットフォームで利用可能。
- 無料 tier は現在 Sonnet 4.6 がデフォルトで、ファイル作成、コネクタ、スキル、コンテキスト圧縮が含まれる。
はじめ方
- 開発者向け:API を介して
モデルを呼び出す。claude-sonnet-4-6 - 適応型思考と拡張思考を比較し、速度と精度のトレードオフに合わせてエフォート設定を調整する。
- 新しいツール(Web検索、コード実行、メモリ)を活用してトークン効率を向上させる。
関連情報
- アンタロプ・ルワンダ政府との MOU:医療と教育における AI の協力。
- インフォシス社との共同プロジェクト:電気通信や規制産業向け AI エージェントの開発。
- バンガロール新オフィス設立とインド全土でのパートナーシップ拡大。