**Claude Sonnet 4.6**(クロード・ソネット 4.6)

2026/02/18 2:48

**Claude Sonnet 4.6**(クロード・ソネット 4.6)

RSS: https://news.ycombinator.com/rss

要約

Japanese Translation:

Claude Sonnet 4.6 は Anthropic の最新かつ最も優れた Sonnet モデルで、現在すべての Claude プラン(Free と Pro)でデフォルトとなっています。価格は Sonnet 4.5 と同じままで、1 兆トークンあたり $3 / $15 です。このモデルは 1,000,000 トークンのコンテキストウィンドウ(ベータ版)、適応/拡張思考、コンテキスト圧縮、自動ウェブ検索フィルタリング、拡張ツール例、および Excel の MCP コネクタサポートを導入しています。

初期ユーザーは、Sonnet 4.5 に対してコードの正確性、一貫性、指示追従、全体的なパフォーマンスで大幅に優れていると報告しています。特に Opus 4.5 を約 70%(59%)上回る性能を発揮しています。OSWorld、Vending‑Bench Arena、OfficeQA、Financial Services Benchmark、保険ワークフローなどのベンチマークでは、複雑なスプレッドシートや多段階ウェブフォームでほぼ人間レベルの結果が得られ、Sonnet 4.6 は Opus 4.6 と同等またはそれに近い性能を示しつつ、コストも低く抑えられています。安全性評価では大きな不整合問題は確認されず、プロンプトインジェクション耐性は Opus 4.6 と同等です。

製品アップデートには、フロントエンド設計とコード修正の改善(例:楽天 AI 用の最高 iOS コード)や保険ベンチマークで 94% の精度率が含まれます。Claude Code、API、および主要クラウドプラットフォーム全体で拡張された可用性により、Sonnet 4.6 はスプレッドシート自動化、保険ワークフロー、複雑なウェブ操作などのタスクにおいて、コード精度の向上、安全な対話、および低い導入コストを提供し、多くの産業で生産性ツールを再構築する可能性があります。

本文

Claude Sonnet 4.6 – 概要

  • モデルの機能

    • コーディング、コンピュータ利用、長文推論、エージェント計画、知識作業、設計スキルを含む全般的なアップグレード。
    • 1 Mトークン(ベータ版)のコンテキストウィンドウ。
    • claude.ai および Claude Cowork の無料・Proプランでデフォルトモデルとして採用;価格は Sonnet 4.5 と同じ($3/15 万トークン)。
  • 性能のハイライト

    • コーディングの一貫性、指示追従、およびユーザー嗜好に関して Sonnet 4.5、さらには2025年11月リリースの Opus 4.5 を上回る。
    • 多くのオフィスタスクで Opus クラスの性能を低コストで実現。
    • 安全性も高い:暖かく正直、親社会的で、安全行動が強化されており、大きな不整合は報告されていない。
  • コンピュータ利用

    • 初の汎用コンピュータ利用モデル(2024年10月公開)。
    • OSWorld ベンチマークを使用し、API を介さずに Chrome、LibreOffice、VS Code 等実際のソフトウェアと対話する能力を評価。
    • 16か月にわたり継続的な向上;初期ユーザーは複雑なスプレッドシートやマルチタブワークフローで人間レベルに近い性能を報告。
    • 上位の人間専門家にはまだ劣るが、進歩は速い。
  • 安全性・プロンプトインジェクション

    • Sonnet 4.5 と比較してプロンプトインジェクションへの耐性が強化され、Opus 4.6 と同等。
    • API ドキュメントに詳細な緩和ガイダンスが記載。
  • ベンチマークとユースケース

    • コード:ユーザーは約70%の確率で Sonnet 4.6 を Sonnet 4.5 より好む;Opus 4.5 に対しても59%好まれる。
    • Vending‑Bench Arena:初期投資を早め、後に収益性へ転換する戦略で Sonnet 4.5 を上回る。
    • OfficeQA & Financial Services Benchmark:Opus 4.6 と同等の性能;回答一致率とリコールが大幅向上。
    • 保険ベンチマーク:コンピュータ利用タスク(提出受付、初回損失通知)で94%の正確性を達成。
    • アプリ構築・バグ修正:複雑なビルドや iOS コード生成(楽天 AI の例)においてフロンティアレベルの結果。
    • デザイン・フロントエンド:ページとレポート作成に完璧な感覚を持ち、最小限のサポートで実行可能。
  • プロダクトアップデート

    • Developer Platform:適応型思考、拡張思考、およびベータ版コンテキスト圧縮をサポート。
    • API:Web検索/フェッチツールが自動でコードを書き実行し、結果をフィルタリング;ツール使用例も拡充。
    • Excel アドイン:S&P Global、LSEG、Daloopa、PitchBook、Moody’s、FactSet の MCP コネクターにより、Excel を離れずにコンテキスト取得が可能(Pro、Max、Team、Enterprise)。
  • 利用可否

    • すべての Claude プラン、Claude Cowork、Claude Code、API、および主要クラウドプラットフォームで利用可能。
    • 無料 tier は現在 Sonnet 4.6 がデフォルトで、ファイル作成、コネクタ、スキル、コンテキスト圧縮が含まれる。

はじめ方

  1. 開発者向け:API を介して
    claude-sonnet-4-6
    モデルを呼び出す。
  2. 適応型思考と拡張思考を比較し、速度と精度のトレードオフに合わせてエフォート設定を調整する。
  3. 新しいツール(Web検索、コード実行、メモリ)を活用してトークン効率を向上させる。

関連情報

  • アンタロプ・ルワンダ政府との MOU:医療と教育における AI の協力。
  • インフォシス社との共同プロジェクト:電気通信や規制産業向け AI エージェントの開発。
  • バンガロール新オフィス設立とインド全土でのパートナーシップ拡大。

同じ日のほかのニュース

一覧に戻る →

2026/02/18 2:06

ありがとうございます、HNさん。おかげさまで約3万3千人もの命を救うことができました。

## Japanese Translation: ## Summary: Watsi.org は Show HN の立ち上げから始まり、Hacker News からの大量トラフィックに急速に引き寄せられ、寄付が急増し、世界中で手術ケアのために 2,000 万ドル以上を調達しました。このプラットフォームは、Hacker News の “pg” が Watsi を Y Combinator 最初の非営利団体として指摘したことで早期の信頼性を獲得し、創設者がユーザーと深く関わり、自らサイトをコーディングし、効率・透明性・継続的改善に注力するようになりました。消費財とは異なり、非営利団体は寄付への熱意曲線が弱く、ケア要請は爆発的に増加した一方で寄付額は線形にしか成長せず、バーンアウトと取締役会主導の持続可能な成長への転換を招きました。結果として Watsi の戦略は今や積極的拡大ではなく、安定した段階的スケーリングを重視し、長期的な実現可能性を目指しています。このモデルはテックコミュニティが非営利団体を持続可能に支援できる方法を示しており、将来の YC 非営利プロジェクトや広範なチャリティ・テック分野への影響力を持つ設計図となります。 ## Summary Skeleton **What the text is mainly trying to say (main message)** Watsi.org は Show HN で始まり、Hacker News のトラフィックにより急速に成長し、現在は手術のために 2,000 万ドル以上を調達した持続可能な非営利団体として運営されています。 **Evidence / reasoning (why this is said)** - Show HN を通じて立ち上げ → 大量トラフィックが発生。 - Hacker News の “pg” が最初の大きなチェックを行い、Watsi を YC 最初の非営利団体として認識。 - 創設者はユーザーと時間を共有し、自らコードを書き、効率・透明性・革新を優先。 **Related cases / background (context, past events, surrounding info)** - 非営利団体のプロダクト‑マーケットフィットは消費財とは異なり、寄付への熱意が弱い。 - 寄付額は線形に成長した一方でケア要請は爆発的に増加し、バーンアウトと取締役会による持続可能な成長への転換を招く。 **What may happen next (future developments / projections written in the text)** 戦略は急速な拡大ではなく、ゆっくりとした安定的で持続可能な軌道へシフトしており、継続的に段階的スケーリングと長期的実現性への焦点が期待される。 **What impacts this could have (users / companies / industry)** ユーザーは手術のための信頼できる資金調達を享受し、寄付者は資金の透明な使用を見ることができます。このモデルはテックコミュニティが非営利団体を持続可能に支援する方法を示しており、将来の YC 非営利プロジェクトや広範なチャリティ・テック分野への影響力を高める。

2026/02/18 4:24

**HN ストーリー:AsteroidOS 2.0 – みんなが聞かなくても、私たちはリリースしました**

## 日本語訳: **改訂概要** AsteroidOS 2.0は2026年2月17日にリリースされ、ファームウェアの機能セットとデバイスサポートを拡張し、将来の開発計画を概説しています。主要な新機能にはAlways‑on‑Displayモード、滑らかなUIアニメーション、電池寿命の向上、およびAndroid用に更新されたAsteroidOS Syncクライアントを動力付けるモジュラーBluetoothライブラリが含まれます。Gadgetbridge(v0.73.0)は同じライブラリをサポートし、Amazfish(SailfishOS/Linux)とTelescope(Ubuntu Touch)が同期エコシステムに追加されました。このリリースはウォッチの互換性を30デバイスに拡大し、Fossil Gen 4–6、Huawei Watch/Watch 2、LG Watch W7、Moto 360 2015、OPPO Watch、Polar M600、さまざまなTicwatchモデルをカバーします。また、Casio WSD‑F10/F20、LG Watch Urbane 2、Moto 360 1st gen、Samsung Gear 2/Liveの5つの実験的ウォッチが追加され、Sony Smartwatch 3は降格されました。 新しいUI改良にはランチャースタイルオプションとカスタマイズ可能なクイック設定が含まれます。コミュニティへの貢献も強調されており、Weblateを通じて20以上の言語に翻訳され、ウォッチフェイス作成ガイドが公開されました。また、moWerk、MagneFire、Dodoradio、Berosetなどの顕著な貢献者が認められています。インフラストラクチャーの更新には、FAQやウォッチギャラリーを備えた拡張ウェブサイト、MediaWikiへのドキュメント移行、公式サブレディットの立ち上げ、およびコミュニティ通信をMatrixとLibera.chatへシフトすることが含まれます。新しいコミュニティリポジトリは事前コンパイルされたパッケージ、ウォッチフェイス、ゲーム、およびエミュレーターをホストし、毎晩のリリースはより頻繁になりましたが、すべてのイメージを再構築するには約1週間かかります。 将来の計画には、統合フィットネスアプリ、設定経由でのWi‑Fiセットアップ、ウォッチフェイス作成とファームウェアフラッシュ用のWebベースツール、アプリストア、および1.0リリースサイクルから安定した頻繁なリリースを目指すクォーシー1.1ナイトリー型モデルへの移行が含まれます。ユーザーは公式ウェブサイトからAsteroidOS 2.0をダウンロードし、提供された手順でインストールし、GitHubのIssueやWeblate翻訳を通じて貢献するよう奨励されています

2026/02/18 5:35

バーラCUDA ― AMD GPU 向けに設計されたオープンソースの CUDA コンパイラー

## 日本語訳: (以下は原文を日本語に翻訳したものです) --- ## BarraCUDA – AMD GPU 用の LLVM‑free CUDA コンパイラ BarraCUDA は、約15,000行の C で書かれたオープンソースの C99 ベースの CUDA コンパイラです。AMD RDNA 3(GFX1100)GPU を対象とし、LLVM やその他外部ビルドツールに依存せずに ELF .hsaco バイナリを生成します – ただ単に `make` で構築できます。 ### アーキテクチャ パイプラインは完全に文書化されています: `preprocessor → lexer → recursive‑descent parser → semantic analysis → SSA BIR → mem2reg promotion → instruction selection → register allocation → binary encoding → ELF emission`。 ホットパスには再帰や動的メモリが含まれず、コンパイラはデバッグ用に AST (`--ast`) または IR (`--ir`) をダンプできます。また、完全な C 前処理器、エラー回復、ソース位置追跡、および構造体の値渡し処理も実装されています。 ### サポートされる CUDA 機能 - グローバル/デバイス/ホスト修飾子;スレッド/ブロック組み込み - 完全な C 制御フロー(if/else、ループ、switch/case、goto)と短絡論理 - 基本的なテンプレート、演算子オーバーロード、複数の戻りパス、`continue`/`break` - `__shared__` メモリ(LDS 配分)、`__syncthreads()`、アトミック、ワープ内蔵関数(`__shfl_sync` バリアント)、ベクトル型(float2–4, int2–4)、half 精度、`__launch_bounds__`、協調グループ - `__shared__` メモリ、アトミック操作、および上記のキーポイントに列挙されているその他の CUDA プリミティブ ### 現在の制限事項 符号なし型(bare unsigned types)、複合代入(`+=`, `-=` など)、const 修飾子、`__constant__` メモリ、2‑D シェアードメモリ配列、整数リテラル接尾辞、`__device__` 関数内のパラメータ再代入、テクスチャ/サーフェイス、動的並列処理、多重翻訳単位、およびホストコード生成はまだサポートされていません。 ### テストスイート テストハーネスには 14 ファイルが含まれ、35 を超えるカーネル(約1,700 BIR 命令、約27 KB マシンコード)があります。アトミック操作、ワープ演算、バリア、テンプレート、協調グループ、および複雑な「キッチンシンク」AI 生成カーネルを実行します。 ### ロードマップ - **近期**:パーサーの強化とギャップ埋め。 - **中期**:命令スケジューリング、レジスタ割り当て、定数フォールディング、ループ不変動作移動、占有率チューニング。 - **長期**:新しいアーキテクチャのサポート(Tenstorrent RISC‑V AI アクセラレーター、Intel Arc Xe、RISC‑V Vector)。 ### エンコーディングに関する注意点 - AMDGPU 命令プレフィックスは直感的でない:SOP1 (`0xBE800000`)、SOPC (`0xBF000000`)。 - VOP3 命令は VDST ビットを使用して宛先選択を行う。 - Null SADDR 値は `0xffffffff` とエンコードされる。 - RDNA 3 カーネルはデフォルトで Wave32(Wave64 ではない)を使用。 ### ライセンスとコミュニティ BarraCUDA は Apache 2.0 の下でリリースされています。問題や議論は GitHub またはメール(zanehambly@gmail.com)で報告できます。この軽量で LLVM‑free なツールチェーンは、AMD GPU および新興アクセラレーターエコシステム向けに開発する学術機関や小規模チームに魅力的かもしれません。 ---