クラウド・オーパス 4.6 (Claude Opus 4.6)

2026/02/06 2:38

クラウド・オーパス 4.6 (Claude Opus 4.6)

RSS: https://news.ycombinator.com/rss

要約

Japanese Translation:

改善された要約

Claude Opus 4.6 は ベータ版 1 M‑トークンコンテキストウィンドウ を備えてリリースされ、最大で 128 k トークン を出力できます。GDPval‑AA においては GPT‑5.2 より約 144 Elo の優位を示し、前モデルよりも 190 Elo ポイント で上回っています。金融・法務・その他の高価値タスクで卓越した性能を発揮しています。Terminal‑Bench 2.0 ではすべてのフロンティアモデルを凌駕し、Humanity’s Last ExamBrowseComp においても同様です。サイバーセキュリティ分野では Opus 4.6 が Claude 4.5 を対象とした9つのサブエージェントと100件を超えるツール呼び出しで、38/40 の盲検ランキング で勝利しています。長期コンテキスト性能は MRCR v2 の 1 M‑トークンニードルインハイスタックベンチマークで 76 % を達成し、Sonnet 4.5 の 18.5 % を大幅に上回っています。安全性監査では最近の Claude リリース中で最も低い過剰拒否率を示し、整合性の欠如した行動が増加している兆候はありません。

新しい API 機能には 適応的思考、4 つの努力レベル(低〜最大)、コンテキスト圧縮(ベータ) が含まれ、拡張されたコンテキスト機能も提供されます。製品更新では Claude Code におけるエージェントチーム、長時間にわたるマルチステップ変更のための強化された Excel 統合、ブランド一貫性を保つレイアウト/フォント読み取り機能を備えた PowerPoint 研究プレビューが追加されました。モデルの計画とサブエージェント調整により、複雑なコーディングタスクや法的推論(BigLaw Bench スコア 90.2 %)が可能になり、以前のモデルと比べて大規模コードベース移行を半分に短縮します。価格は標準使用で 1M トークンあたり 5 USD / 25 USD のままで、200k トークン以上の入力/出力の場合はプレミアムレート(10 USD / 37.50 USD)が適用されます。Opus 4.6 は claude.ai、Claude API、および主要クラウドプラットフォーム(AWS、GCP、Azure) で今日から利用可能です。すべての安全性と能力評価は Claude Opus 4.6 システムカード に記載されています。

本文

私たちは最も知能的なモデルをアップグレードしています。
新しい Claude Opus 4.6 は、前世代のコーディングスキルをさらに向上させています。

  • より慎重に計画し、エージェントタスクを長時間維持できるようになり、大規模コードベースでもより安定して動作します。
  • コードレビューとデバッグ能力が向上し、自身のミスも検出できます。
  • 1 Mトークン(テスト版)のコンテキストウィンドウを備えています。

Opus 4.6 は、日常業務にもその優れた機能を適用します。財務分析、リサーチ、ドキュメント・スプレッドシート・プレゼンテーションの作成など、Claude が自律的にマルチタスクできる Cowork 内で、すべてのスキルがあなたの代わりに活用されます。

パフォーマンスハイライト

  • Terminal‑Bench 2.0 で最高点を取得したエージェント型コーディング評価。
  • Humanity’s Last Exam(多分野推論)で他のフロンティアモデルをリード。
  • GDPval‑AA(財務・法務等)では GPT‑5.2 を約144 Elo、Claude Opus 4.5 を190ポイント上回ります。
  • BrowseComp で最も優れた性能を示し、難しいオンライン情報の検索が可能です。
  • 他のフロンティアモデルと同等かそれ以上の安全プロファイルを維持しています。

新機能

機能説明
Claude Code Agent Teams複数のエージェントを並列で起動し、自己調整で協働します。
Context Compaction (beta)会話が設定可能な閾値に近づくと古いコンテキストを要約し、長時間タスクでも制限に達しません。
Adaptive Thinkingモデル自身がより深い推論が有効か判断し、開発者は努力レベルを調整できます。
Effort Levels低・中・高(デフォルト)・最大の4段階。
1 M Token Context Window1 Mトークンコンテキストを持つ初の Opus‑クラスモデル(200kトークン超はプレミアム価格)。
128k Output Tokens最大128kトークンまで出力でき、複数リクエストに分割されません。
US‑Only Inference米国でのみ実行が必要なワークロードに対し 1.1× トークン価格で利用可能。

製品・APIアップデート

  • Claude in Excel – 長時間かつ難易度の高いタスクで性能向上、事前計画と非構造化データから構造を推論。
  • Claude in PowerPoint(リサーチプレビュー) – Excel のデータを処理・構造化し、ブランドに沿った視覚的プレゼンテーションへ変換。

安全性・整合性

  • 誤情報や奉仕行動の発生率が低い。
  • 最新 Claude モデルで最も低い過剰拒否率を実現。
  • ユーザー福祉、危険リクエスト拒否、潜在的有害行動への包括的安全評価を実施。
  • 6 つの新しいサイバーセキュリティプローブで悪用検知能力を強化。

利用可否・価格

  • claude.ai、API、および主要クラウドプラットフォームで今日から利用可能。
  • Claude API で claude‑opus‑4‑6 を使用。
    料金:$5 / $25/百万トークン(従来と同価格)。
    200k トークン超のプロンプトにはプレミアム価格($10 / $37.50/百万入力/出力トークン)。

要約すると: Claude Opus 4.6 は、これまでで最も強力なモデルです。コーディング・推論・長期コンテキスト性能が優れ、安全性はトップクラス。ソフトウェア開発から財務・法務分析、サイバーセキュリティ、デザインシステムに至るまで、複雑なタスクを解決する準備ができています。

同じ日のほかのニュース

一覧に戻る →

2026/02/06 6:24

2026年です。PostgreSQLだけで十分です。

## Japanese Translation: (余計な推測を除外し、核心となる事実のみを明確に保つ) **概要** このページは訪問者にティガーデータニュースレターの購読を促しています。購読手続きを行うことで、ユーザーは自動的にティガーデータのプライバシーポリシーを読み、同意したことを認めます―購読そのものがポリシーへの承諾として機能します。© 2026 の著作権表示は現在年を示し、所有者欄にタイムスケール社(Tiger Data 名義)が記載されていることで所有権を明確化しています。購読者には今後のニュースレターが送付され、製品やサービスの更新情報が含まれる可能性があります。

2026/02/06 4:04

**私のAI導入ジャーニー**

## Japanese Translation: (主要なポイントをすべて取り込み、根拠のない推測を避ける) --- ## 要約 この記事では、ソフトウェア開発にAIエージェントを導入するための**6つの実践的ワークフロー**を示し、派手なデモよりも実際の生産性向上を重視しています。 1. **汎用チャットインターフェースを拒否する** – ChatGPTやGeminiなどを使うことはやめ、人間による継続的な修正が必要になるためです。 2. **タスク固有のエージェントを構築する**。ファイルを読み取り、プログラムを実行し、HTTPリクエストを送信できるようにします。各エージェントの限界を学ぶため、手作業で同じタスクを2回重複して実行します。 3. **毎日の最後の30分間にエージェントを動かす**。深いリサーチや並列アイデア探索、GitHub CLI を使った問題/PR のトリアージを行い、翌朝には「ウォームスタート」を実現します。 4. **高確信タスクはエージェントに委譲し、著者は他の手作業に集中する**。通知を無効化してコストのかかるコンテキストスイッチを回避します。 5. **ハーネス(“harness engineering”)を設計する**。暗黙的プロンプト(例:AGENTS.md での更新)やスクリプトツールを追加し、エージェントが自己検証できるようにしてミスを減らします。 6. **バックグラウンドエージェントを維持する**。1日あたり10–20 % の時間で動作させ、GPT‑5.2‑Codex などのより深いモデルを長文変更時にのみ使用し、測定可能な価値がある場合に限定します。 著者はAIについて計測的かつ実践的な見方を強調しています。ワークフロー効率を優先し、ジュニア開発者のスキル低下を避け、企業関係や説得力のない情報を提供せずに個人的洞察として共有することを述べています。

2026/02/05 4:19

エプスタインPDFを、生データのエンコードされた添付ファイルから再構築する

## Japanese Translation: 最新の DOJ エプスタインアーカイブダンプには、埋め込みベース64エンコードされた添付ファイルを標準的な OCR ツールで信頼性高く復元できない、多数の破損した PDF が含まれています。 - **OCR の失敗:** Adobe Acrobat Pro、ImageMagick の `convert`(キャッシュ不足)、Poppler の `pdftoppm` + Tesseract、および Amazon Textract はすべてノイズの多い出力を生成します:余計なコンマや角括弧、不必要なスペース、欠落したベース64文字、行長の不一致など。Courier New フォントでは「1」と「l」を区別しにくいため、手動で試行錯誤する修正が必要になります。 - **例ファイル:** `EFTA00400459.pdf` は 76 ページからなる PDF で、大きなベース64添付ファイル(`DBC12 One Page Invite with Reply.pdf`)を含んでいます。 - **部分的な deflate 圧縮:** クリーンアップされたベース64テキストを見ると、埋め込み PDF は部分的に deflate 圧縮されていることが判明します。しかし、ソース PDF 自体が破損しているため、`qpdf` などのツールでは復元できません。 - **試みた改善策:** Acrobat OCR を再実行すると状態が悪化しました。画像を 2× スケーリングした後に Textract に入力すると、結果はわずかに改善されました。 - **課題:** クリーンアップされたベース64出力から元の PDF を再構築し、最新のエプスタインダンプ内で回復可能な他の添付ファイルを特定してください。成功すれば、調査官、ジャーナリスト、および研究者が機密性の高い文書により明確にアクセスできるようになり、破損した法的 PDF に対する OCR の限界も浮き彫りになります。 - **付随資料:** 著者は原始的な `EFTA00400459.pdf`、各ページのロスレス WebP 画像、および Amazon Textract OCR 結果(2× スケーリング版を含む)をインターネットアーカイブにアップロードし、参照用に提供しています。