**Contra:検索なしで挑むグランドマスターレベルのチェス(2024)**

2026/02/16 12:22

**Contra:検索なしで挑むグランドマスターレベルのチェス(2024)**

RSS: https://news.ycombinator.com/rss

要約

日本語訳:

以下は、主要なポイントをすべて取り入れつつ、言葉遣いを明確かつ簡潔に保った改訂版です。


要約

Google DeepMind は 2024 年 2 月 13 日に Amortized Planning with Large‑Scale Transformers: A Case Study on Chess を発表しました。このトランスフォーマー ベースのモデルは Stockfish 16 のデータで訓練され、チェス盤を入力として受け取り、50 ms の Stockfish 検索後に次の 3 つの量を出力します。

  1. 状態価値 – ポジションがどれだけ良いか。
  2. 行動価値 – 各手の期待報酬。
  3. 方策分布 – 50 ms Stockfish の選択と一致する確率。

アーキテクチャは AlphaZero の方策/価値ネットワークを鏡写しにしており、行動価値ヘッドという新しい追加が特徴です。強度はモデルの方策を、その価値推定による深さ 1 のロールアウトと比較することで評価されました。著者らはグランドマスター級のプレイを主張し、Lichess Blitz のレーティング 2895 を引用しています。

長時間制御では「より深く考える」ことができないためレーティングが低下する可能性があると注意喚起しています。批評家はこの研究に新規性が欠けていると主張し、Leela Chess Zero はすでに AlphaZero を方策 Elo で上回っており、LC0‑Value バリアントは約 2400 Elo に達する可能性があると指摘しています。論文ではモデルが Stockfish を打ち破るゲームも示されており、その結果は訓練データから考えると予想外で、人間のマスターが Stockfish より弱いことに起因する差異があるかもしれないと示唆しています。

付録では AlphaZero、今回のトランスフォーマーモデル、および LC0 の「サーチレス」(1‑ply 価値最大化)パズル解法を比較し、それぞれのアプローチの相対的な性能を強調しています。

本文

2024年2月13日

Google DeepMindは最近 Amortized Planning with Large‑Scale Transformers: A Case Study on Chess を発表し、強力なチェスエンジン Stockfish 16(現在は新バージョンに取って代わられています)で訓練されたトランスフォーマーベースのモデルを紹介しました。このモデルはゲーム状態を入力として受け取り、以下の3つの量を出力するよう学習します。

  • State value – 50 ms Stockfish 検索により決定される状態価値。
  • Action value – 状態 s において行動 a を取ったときの価値(同じく 50 ms Stockfish 検索)。
  • Policy distribution – 状態 s の全ての手に対する確率分布で、50 ms Stockfish の選択と一致させることを目指す。

訓練後、このモデルは与えられた状態で行動を選択してチェスをプレイできます。構造は AlphaZero の AZ‑style ネットワーク(ポリシーとバリューのみを予測)に極めて似ていますが、ここでは別個のアクション価値出力が追加されています。

論文中で著者らはモデルのプレイ強度を AlphaZero と比較し、次の2通りの手法を採用しています。

  1. AZ モデルのポリシー(最も高い確率を持つ手を選択)
  2. モデルの価値推定を使用し、合法手全てに対して深さ1 のロールアウトを行い、得られた状態価値が最大となる手を選択(技術的には探索プロセスですが、著者はそれを「検索」と呼んでいません)

主張

著者らは自モデルがグランドマスター級のチェスプレイヤーであると主張し、その根拠として Lichess Blitz での評価 2895 を挙げています。これは印象的ですが、時間制限が長くなると「より深く考える」ことができないため、Elo は下がる可能性があります。

批判的視点

論文の新規性は疑問です。Leela Chess Zero(Lc0)などのオープンソースプロジェクトは AlphaZero の純粋なポリシー強度を上回っています。例えば:

  • BT4(現在最強の Lc0 ネットワーク)は、AlphaZero に近い T30/T40 よりも +547 Elo(T40 上)および +628 Elo(T30 上)の優位性を示しています。
  • これらの差は Lc0 を DeepMind の 136M パラメータトランスフォーマーと同等レベルに押し上げます(ポリシーのみで 1620 + 600 = 2220 Elo)。
  • AZ ネットワークが付加するバリューヘッド(+230 Elo)を考慮すると、BT4‑Value は論文のトーナメント Elo で約 2400 を獲得できると推定されます。

著者らの後続ゲーム分析は奇妙です。Stockfish を模倣するように訓練されたモデルが Stockfish を上回ることを受け入れており、これは訓練データから考えて起こり得ない結果です。また、人間マスター(Elo は Stockfish より数百点低い)に訴えることでこの矛盾を解消しようとしています。

結論

総じて、この論文は分野内で既存の重要な研究を軽視しており、独創性や手法に疑問が残ります。


補足

AlphaZero、論文モデル、および Lc0 の「検索なし」(1‑ply バリュー最大化) パズル解決能力の比較を以下に示します。

同じ日のほかのニュース

一覧に戻る →

2026/02/18 2:48

**Claude Sonnet 4.6**(クロード・ソネット 4.6)

## Japanese Translation: **Claude Sonnet 4.6** は Anthropic の最新かつ最も優れた Sonnet モデルで、現在すべての Claude プラン(Free と Pro)でデフォルトとなっています。価格は Sonnet 4.5 と同じままで、1 兆トークンあたり $3 / $15 です。このモデルは 1,000,000 トークンのコンテキストウィンドウ(ベータ版)、適応/拡張思考、コンテキスト圧縮、自動ウェブ検索フィルタリング、拡張ツール例、および Excel の MCP コネクタサポートを導入しています。 初期ユーザーは、Sonnet 4.5 に対してコードの正確性、一貫性、指示追従、全体的なパフォーマンスで大幅に優れていると報告しています。特に Opus 4.5 を約 70%(59%)上回る性能を発揮しています。OSWorld、Vending‑Bench Arena、OfficeQA、Financial Services Benchmark、保険ワークフローなどのベンチマークでは、複雑なスプレッドシートや多段階ウェブフォームでほぼ人間レベルの結果が得られ、Sonnet 4.6 は Opus 4.6 と同等またはそれに近い性能を示しつつ、コストも低く抑えられています。安全性評価では大きな不整合問題は確認されず、プロンプトインジェクション耐性は Opus 4.6 と同等です。 製品アップデートには、フロントエンド設計とコード修正の改善(例:楽天 AI 用の最高 iOS コード)や保険ベンチマークで 94% の精度率が含まれます。Claude Code、API、および主要クラウドプラットフォーム全体で拡張された可用性により、Sonnet 4.6 はスプレッドシート自動化、保険ワークフロー、複雑なウェブ操作などのタスクにおいて、コード精度の向上、安全な対話、および低い導入コストを提供し、多くの産業で生産性ツールを再構築する可能性があります。

2026/02/18 2:06

ありがとうございます、HNさん。おかげさまで約3万3千人もの命を救うことができました。

## Japanese Translation: ## Summary: Watsi.org は Show HN の立ち上げから始まり、Hacker News からの大量トラフィックに急速に引き寄せられ、寄付が急増し、世界中で手術ケアのために 2,000 万ドル以上を調達しました。このプラットフォームは、Hacker News の “pg” が Watsi を Y Combinator 最初の非営利団体として指摘したことで早期の信頼性を獲得し、創設者がユーザーと深く関わり、自らサイトをコーディングし、効率・透明性・継続的改善に注力するようになりました。消費財とは異なり、非営利団体は寄付への熱意曲線が弱く、ケア要請は爆発的に増加した一方で寄付額は線形にしか成長せず、バーンアウトと取締役会主導の持続可能な成長への転換を招きました。結果として Watsi の戦略は今や積極的拡大ではなく、安定した段階的スケーリングを重視し、長期的な実現可能性を目指しています。このモデルはテックコミュニティが非営利団体を持続可能に支援できる方法を示しており、将来の YC 非営利プロジェクトや広範なチャリティ・テック分野への影響力を持つ設計図となります。 ## Summary Skeleton **What the text is mainly trying to say (main message)** Watsi.org は Show HN で始まり、Hacker News のトラフィックにより急速に成長し、現在は手術のために 2,000 万ドル以上を調達した持続可能な非営利団体として運営されています。 **Evidence / reasoning (why this is said)** - Show HN を通じて立ち上げ → 大量トラフィックが発生。 - Hacker News の “pg” が最初の大きなチェックを行い、Watsi を YC 最初の非営利団体として認識。 - 創設者はユーザーと時間を共有し、自らコードを書き、効率・透明性・革新を優先。 **Related cases / background (context, past events, surrounding info)** - 非営利団体のプロダクト‑マーケットフィットは消費財とは異なり、寄付への熱意が弱い。 - 寄付額は線形に成長した一方でケア要請は爆発的に増加し、バーンアウトと取締役会による持続可能な成長への転換を招く。 **What may happen next (future developments / projections written in the text)** 戦略は急速な拡大ではなく、ゆっくりとした安定的で持続可能な軌道へシフトしており、継続的に段階的スケーリングと長期的実現性への焦点が期待される。 **What impacts this could have (users / companies / industry)** ユーザーは手術のための信頼できる資金調達を享受し、寄付者は資金の透明な使用を見ることができます。このモデルはテックコミュニティが非営利団体を持続可能に支援する方法を示しており、将来の YC 非営利プロジェクトや広範なチャリティ・テック分野への影響力を高める。

2026/02/18 4:24

**HN ストーリー:AsteroidOS 2.0 – みんなが聞かなくても、私たちはリリースしました**

## 日本語訳: **改訂概要** AsteroidOS 2.0は2026年2月17日にリリースされ、ファームウェアの機能セットとデバイスサポートを拡張し、将来の開発計画を概説しています。主要な新機能にはAlways‑on‑Displayモード、滑らかなUIアニメーション、電池寿命の向上、およびAndroid用に更新されたAsteroidOS Syncクライアントを動力付けるモジュラーBluetoothライブラリが含まれます。Gadgetbridge(v0.73.0)は同じライブラリをサポートし、Amazfish(SailfishOS/Linux)とTelescope(Ubuntu Touch)が同期エコシステムに追加されました。このリリースはウォッチの互換性を30デバイスに拡大し、Fossil Gen 4–6、Huawei Watch/Watch 2、LG Watch W7、Moto 360 2015、OPPO Watch、Polar M600、さまざまなTicwatchモデルをカバーします。また、Casio WSD‑F10/F20、LG Watch Urbane 2、Moto 360 1st gen、Samsung Gear 2/Liveの5つの実験的ウォッチが追加され、Sony Smartwatch 3は降格されました。 新しいUI改良にはランチャースタイルオプションとカスタマイズ可能なクイック設定が含まれます。コミュニティへの貢献も強調されており、Weblateを通じて20以上の言語に翻訳され、ウォッチフェイス作成ガイドが公開されました。また、moWerk、MagneFire、Dodoradio、Berosetなどの顕著な貢献者が認められています。インフラストラクチャーの更新には、FAQやウォッチギャラリーを備えた拡張ウェブサイト、MediaWikiへのドキュメント移行、公式サブレディットの立ち上げ、およびコミュニティ通信をMatrixとLibera.chatへシフトすることが含まれます。新しいコミュニティリポジトリは事前コンパイルされたパッケージ、ウォッチフェイス、ゲーム、およびエミュレーターをホストし、毎晩のリリースはより頻繁になりましたが、すべてのイメージを再構築するには約1週間かかります。 将来の計画には、統合フィットネスアプリ、設定経由でのWi‑Fiセットアップ、ウォッチフェイス作成とファームウェアフラッシュ用のWebベースツール、アプリストア、および1.0リリースサイクルから安定した頻繁なリリースを目指すクォーシー1.1ナイトリー型モデルへの移行が含まれます。ユーザーは公式ウェブサイトからAsteroidOS 2.0をダウンロードし、提供された手順でインストールし、GitHubのIssueやWeblate翻訳を通じて貢献するよう奨励されています

**Contra:検索なしで挑むグランドマスターレベルのチェス(2024)** | そっか~ニュース