**AGIへの進捗測定:認知的枠組み**

2026/03/18 20:44

**AGIへの進捗測定:認知的枠組み**

RSS: https://news.ycombinator.com/rss

要約

Japanese Translation:

要約:
Google DeepMindは論文「Measuring Progress Toward AGI: A Cognitive Taxonomy」を発表し、AIシステムの認知能力を評価するフレームワークを提示しました。この分類法は、知覚・生成・注意・学習・記憶・推論・メタ認知・実行機能・問題解決・社会的認知という10の主要な能力を列挙し、AI のパフォーマンスを人間ベースラインと比較する三段階プロトコルを提案しています。
このフレームワークを具現化するために、DeepMindは「Measuring progress toward AGI: Cognitive abilities」という Kaggle ハッカソンを開催しました。この課題では、学習・メタ認知・注意・実行機能・社会的認知の5つの能力について、Kaggle の Community Benchmarks プラットフォームを用いて具体的な評価手法を開発することが求められます。
賞金総額は 200,000 USD で、各トラック(合計5トラック)の上位2件にそれぞれ10,000 USD が授与され、全体のトップ4件には25,000 USD のグランプリが授与されます。提出期間は3月17日から4月16日までで、結果発表は6月1日に行われます。
成功すれば、これらの評価ツールは研究者や企業により人間らしい AI システム設計を導く手助けとなり、資金配分の優先順位に影響を与え、重要な応用領域での AI 安全性評価にも寄与する可能性があります。

本文

AGIへの進捗を測定する – 認知能力の分類体系

Google DeepMind は、AI システムの認知的機能を評価するための新しい枠組みを公開し、必要な評価手法を構築するための Kaggle ハッカソンを開催します。


主要ポイント

  • フレームワーク概要

    • 心理学・神経科学・認知科学における数十年にわたる研究成果を基盤としています。
    • 一般知能に不可欠であると考えられる10の重要な認知能力を特定します。
      1. 知覚(Perception) – 環境から感覚情報を抽出・処理すること
      2. 生成(Generation) – テキスト、音声、行動などのアウトプットを作成すること
      3. 注意(Attention) – 重要な事柄に認知資源を集中させること
      4. 学習(Learning) – 経験や指導によって新しい知識を獲得すること
      5. 記憶(Memory) – 情報を長期的に保存し、必要時に呼び出すこと
      6. 推論(Reasoning) – 論理的推論を通じて妥当な結論を導くこと
      7. メタ認知(Metacognition) – 自らの認知プロセスを意識し、監視すること
      8. 実行機能(Executive Functions) – 計画・抑制・認知柔軟性などを統括すること
      9. 問題解決(Problem Solving) – 専門領域の課題に対し有効な解答を見出すこと
    1. 社会的認知(Social Cognition) – 社会情報を処理・解釈し、適切に反応すること
  • 三段階評価プロトコル

    1. 各能力を網羅した広範なタスク群で AI システムを評価し、テストセットは外部データで保持して汚染を防ぎます。
    2. 同じタスクに対する人口統計学的に代表性のある成人サンプルから人間ベースラインを収集します。
    3. 各 AI システムの性能を、各能力における人間性能分布と比較して位置づけます。
  • Kaggle ハッカソン

    • タイトル:Measuring Progress Toward AGI: Cognitive Abilities
    • 評価ギャップが最も大きい5つの認知能力(学習、メタ認知、注意、実行機能、社会的認知)に焦点を当てます。
    • 参加者は Kaggle の新しい Community Benchmarks プラットフォームを利用して、先端モデルと対照した評価を構築・テストできます。
    • 賞金総額:$200,000
      • 各トラックで上位2件に $10,000 を授与。
      • 全体の4件に対し $25,000 のグランプリ。
  • スケジュール

    • 提出開始日:3月17日
    • 締切:4月16日
    • 結果発表:6月1日

参加方法

  1. Kaggle ウェブサイトへアクセスし、Measuring Progress Toward AGI コミュニティベンチマークに参加します。
  2. 上記5つのターゲット認知能力のうちのいずれかについて堅牢な評価手法を設計します。
  3. 4月16日までに評価結果を提出し、賞金対象として選考されます。

皆様のご参加と創意工夫を心よりお待ちしております。人工汎用知能の未来を共に形作りましょう!

同じ日のほかのニュース

一覧に戻る →

2026/03/19 5:45

再生成された場合、保証は無効となります。

## 日本語訳: > **トム・ハートマンは農業機械の「ソフトウェアメカニック」として自らを再定義しました。** ジョン・ディール社のソフトウェア修理事業が消滅した後、彼は従来のトラブルシューティングから意図された技術動作と実際のパフォーマンス(仕様上の問題)のギャップを診断する方向へシフトしたことを示す新しいサイン「HARTMANN SOFTWARE MECHANICS」を追加しました。 > > 彼の工房では、ハードウェア障害とソフトウェア仕様エラーの両方に対処します。コーヒーマシン実験を通じて、仕様上の欠落がどのように高額な失敗につながるかというドメイン課題を示しています。 > > **クライアント:** > • *マーガレット・ブレナン* – 彼女のキャベツ農場の収穫タイミングツールが天候モデル更新後に成熟度を過小評価したため、トムは仕様に監視条項を追加しました。 > • *イーサン・ノヴァク* – 40種類のカスタムツールを持つ乳製品農家で、「話す」ものがあったが全体的なアーキテクチャが欠如し、飼料ツール再生成後にミルク価格が8 %低下した。トムは「ソフトウェア・チョレオグラファー」(メガン・キャラハン)を提案しました。 > • *キャロル・リンデグレン* – 有機野菜農場で、孫が灌漑最適化ハブを設置。トムは物理的なオーバーライドスイッチとログ記録を提供し、現場固有の知識を保持しました。 > > 共通する問題として「グラウンド・ムーブ」(仕様に捉えられない upstream データ/ソース変更)や「スパゲッティ」(アドホックなツール間インターフェース)が挙げられます。 > > **メトリクス:** 1日あたり6–8件のクライアント、94 % の診断成功率、仕様修正ごとの平均請求額 $180、および継続的な四半期検査。 > > **経済的洞察:** クライアントはしばしば予防保全に抵抗します――失敗よりもコストが低いにもかかわらず―これは人間医療の緊急対応をウェルネスチェックより優先する傾向と似ています。 > > **成果と将来計画:** マーガレットのツールは修復済み、イーサンはチョレオグラフィーを採用予定、キャロルは週に3回オーバーライドスイッチを使用し、トムが四半期ごとに検査を実施します。このアプローチは失敗コストの低減、積極的な保守の奨励、および反応的バグ修正よりも仕様品質を優先する農業技術産業への影響力を高める可能性があります。

2026/03/15 21:20

**オープンロケット**

## Japanese Translation: > **OpenRocket** は、ユーザーがロケットを設計・シミュレーションし、実際に構築する前に最適化できる無料のオープンソースモデルロケットシミュレータです。 > 50以上の変数を備えた最新鋭の六自由度飛行エンジン、リアルタイム性能データ(圧力中心・重心・最大高度・速度・安定性など)、高度なプロット/エクスポート機能を提供します。 > デザイナーは材質密度、仕上げ品質、部品カタログ項目、カスタムパーツを含むCAD風図面を作成し、設計のPDFをエクスポートできます。 > 組み込み AI アシスタントが自動的にパラメータを調整し、高高度などの最適化目標を達成します。 > OpenRocket は ThrustCurve から取得した包括的なデータベースを使用して、マルチステージ・ダブルデプロイメント・クラスターモーター構成をサポートします。 > 本プロジェクトは GitHub を通じて貢献を歓迎し、ユーザーと開発者向けに豊富なドキュメントを提供するとともに、アイデア共有や新機能の議論が行われる活発な Discord コミュニティを維持しています。 > 今後のリリースではプロット/エクスポートツールのさらなる強化、AI 主導の最適化の深化、およびユーザーフィードバックの取り込みを継続します。 この改訂版サマリーはすべての重要ポイントを統合し、非推奨の推論を除外し、あいまいな表現なしに主旨を明確に提示しています。

2026/03/18 16:43

**ワンダー** *小さなウェブを探索するための、ちょっとした分散型ツール*

## 日本語訳: 以下のテキストは「Wander」コンソールのセットアップ方法と使用法について説明しています。 「Wander」は、コミュニティが共有するランダムなウェブサイトを探索できる軽量なWebインターフェースです。 1. **設定手順** - `index.html` と `wander.js` が含まれる ZIP ファイルをダウンロードします。 - これらのファイルを自分のウェブサイトの `/wander/` ディレクトリに展開します。 - `wander.js` を codeberg.org/susam/wander の指示に従って編集します。 - `/wander/` フォルダがオンラインになったら、コミュニティスレッドで自分のコンソールへのリンクを共有します。 2. **動作原理** - 別サイトの Wander コンソールを訪れると、現在のウェブサイトのコンソールからその別サイトのコンソールへ移動します。 - 元のコンソールは他のコンソールから再帰的におすすめを取得できるため、ネットワーク閲覧時にコンソールを変更する必要はありません。 3. **コミュニティの背景** - Wander コミュニティは、自分自身の個人ウェブサイトを開発・運営している人々で構成されています。 - 自分のコンソールを他者のリストに追加することで、Wander ネットワークへの参加が促進されます。 4. **追加情報** - 詳細は codeberg.org/susam/wander をご覧ください。 --- この改訂版要約は、主要なポイントをすべて反映し、根拠のない利益を加えずに主旨を明確かつ簡潔に示しています。