ARC‑AGI‑3(アーク・AGI・3)

2026/03/26 3:16

ARC‑AGI‑3(アーク・AGI・3)

RSS: https://news.ycombinator.com/rss

要約

Japanese Translation:

ARC‑AGI‑3は、AIエージェントを真に適応的かつ継続的な学習へと導く新しい対話型推論ベンチマークです。モデルに探索・目標追求・環境変化への世界モデリングを課し、単発の回答ではなく効率的なスキル獲得と長期計画を評価します。完璧なスコア(100 %)は、エージェントがすべてのゲームで人間よりも優れたまたは同等の性能を示し、多様なタスクにおける習熟度を証明することを意味します。

ベンチマーク設計は、事前学習済み知識なし、明確な目標、有意義なフィードバック、およびブルートフォース記憶化を防ぐ新規性を重視しています。開発者向けには、エージェントの意思決定が構造化されたタイムラインに記録される再生可能実行、使いやすいAPI、環境アクセスとエージェント統合用の包括的ドキュメント、およびリアルタイムでエージェント挙動を確認できるUIが提供されています。

ARC‑AGI‑3は迅速な反復と透明性のある評価を奨励し、研究者が多様なシナリオで継続的に学習可能なAIシステムを構築する手助けとなります。ユーザーはプラットフォーム上のインタラクティブインターフェースを通じて「エージェントをテストしよう!」と呼びかけられ、プレビュー再生でエージェント挙動を反復的にテスト・検査できます。

本文

リンク

ARC‑AGI‑3 とは何ですか?
ARC‑AGI‑3 は、AI エージェントに新しい環境を探索し、臨機応変に目標を設定し、適応可能な世界モデルを構築し、継続的に学習するよう挑戦させる対話型推論ベンチマークです。 100 % のスコアは、AI エージェントが人間と同等の効率であらゆるゲームを攻略できることを意味します。

静的なパズルを解く代わりに、エージェントは各環境内で経験から学びます。重要な情報を知覚し、行動を選択し、自然言語の指示に頼らずに戦略を適応させていきます。


知能を測定する方法

  • 100 % が人間でも解ける環境
  • 時間とともに向上するスキル習得効率
  • スパースなフィードバックでの長期計画
  • 複数ステップにわたる経験駆動型適応

AI と人間の学習にギャップがある限り、我々は AGI を持っていません。ARC‑AGI‑3 は時間を通じて知能をテストし、最終回答だけでなく計画期間・記憶圧縮・新しい証拠が出た際の信念更新能力を測定することで、そのギャップを可視化します。


設計原則

  • 人間がすぐに習得できる
  • 事前にロードされた知識や隠れたプロンプトは無し
  • 明確な目標と意味のあるフィードバック
  • ブルートフォースで丸暗記できない新規性

特徴

ARC‑AGI‑3 は以下を備えています:

  • 再現可能な実行(リプレイ)
  • エージェント統合用開発キット
  • 透明性の高い評価を実現する UI

リプレイ + 評価

プレビューリプレイでエージェントの挙動を確認できます。意思決定、行動、推論を構造化されたタイムラインで追跡しましょう。サンプルリプレイを閲覧してください。

ツールと UI

ARC‑AGI‑3 キットを使ってエージェントを統合し、インタラクティブ UI でテスト・反復します。

ドキュメント

環境、API の使用方法、統合ガイドなど、エージェント構築に必要な情報がすべて揃っています。

ドキュメントを読む → エージェントを試験にかける!

同じ日のほかのニュース

一覧に戻る →

2026/03/26 6:11

テスラ・モデル 3 のコンピュータをデスク上で稼働させ、事故車から取り出した部品を使用しています。

## 日本語訳: ## 要約: この記事では、セキュリティ研究のためにテスラ・モデル 3 MCU(モーター制御ユニット)の取得とセットアップ方法を説明しています。テスラのバグバウンティプログラムが研究者に車両内の脆弱性発見を奨励していることを強調し、筆者はeBayから安価な部品(約 $200–$300)を購入し、DC電源と最大8 Aまで供給可能な12 Vアダプタで組み立てました。さらに、Rosenbergerケーブル(パーツ番号1067960‑XX‑E)が必要で、個別販売されていないためダッシュボードロウムを購入しました。BMW LVDSコネクタを使った初期試行ではMAX16932制御チップがショートし、筆者は現地で修復して2つの機能的MCUを得ました。テスラの電気参照書にケーブル部品番号が確認されています。次のステップとして、MCUのユーザーインターフェース、ネットワークインターフェース(CANバス、ポート 22のSSH、ポート 8080のREST‑ライクAPI)を探索し、システム稼働時にファームウェアを抽出する可能性があります。これらの方法でルートアクセスを取得すると、研究者はテスラの「Root Access Program」のための重要な脆弱性を特定でき、車両セキュリティの向上につながる可能性があります。 ## 要約骨格 **本文が主に伝えたいこと(メインメッセージ)** 筆者はテスラ・モデル 3 MCUを取得し設定する方法を示し、その電源供給とネットワークサービスへのアクセス手順を強調しています。 **根拠/推論(なぜこう言われているか)** - テスラのバグバウンティプログラムは研究者に脆弱性発見を促している。 - 筆者はeBayから安価な部品($200–$300)を購入し、DC電源と最大8 Aまで供給可能な12 Vアダプタで組み立てた。 - 配線には特定のRosenbergerケーブル(パーツ番号1067960‑XX‑E)が必要で、個別販売されていないためダッシュボードロウムを購入した。 **関連ケース/背景(文脈・過去事例・周辺情報)** - BMW LVDSコネクタを使用した初期試行は失敗し、即席配線でMAX16932制御チップがショートした。 - 損傷したチップは現地で修復され、2つの機能的MCUが得られた。 - テスラ公開電気参照書に必要なケーブル部品番号が記載されている。 **今後起こりうること(本文中の将来展望/予測)** 筆者はMCUのユーザーインターフェース、ネットワークインターフェース、CANバスを探索し、システム稼働時にファームウェアを抽出する計画だ。 **影響(利用者・企業・業界への影響)** SSH(ポート 22)またはREST‑ライクAPI(ポート 8080)でMCUにアクセスできれば、研究者はテスラのバグバウンティ「Root Access Program」のための根本的脆弱性を特定し、車両セキュリティ向上に寄与する可能性がある。

2026/03/26 5:27

EUは、依然としてあなたの個人メッセージや写真をスキャンしようとしています。

## Japanese Translation: ## 改訂概要 保守党(欧州人民党)は、無差別スキャンに関する議会の以前の「NO」決定を覆すため、4月26日木曜日に新たな国会投票を求めています。彼らはこの決定を逆転させることが民主主義への攻撃であり、プライバシー権を明白に無視する行為だと主張し、「No means no」というスローガンのもと支持者を集結させています。この要求は、議会が無差別スキャンを承認しなかったことに続くものであり、保守党はこれを政府の過剰介入として捉え、民主主義原則および個人プライバシーを侵害するものと見ています。今後の投票結果は、そのような広範なデータ監視ツールが実施可能かどうかを決定し、市民のプライバシー保護を再構築するとともに、管轄区域内のテクノロジー企業の規制慣行にも影響を与える可能性があります。

2026/03/25 23:12

**タイトル:** 地震科学者が実験農場で示した、過剰耕作が土壌を弱体化させるメカニズム *主要な発見:* - 過剰耕作は自然の土壌構造を乱し、結合力を低下させ侵食に対する感受性を高めます。 - 実験農場で得られたデータによれば、頻繁な深耕は土壌有機物含量を減少させ、その結果地震エネルギーを吸収する能力が低下します。 - 科学者は土壌の健全性を維持し、地震被害リスクを軽減するためにノートイルまたは減耕作業の採用を推奨しています。

## Japanese Translation: 現在の要約はすべての主要ポイントを捉えており、メインメッセージを明確に伝えています。特定の資金提供名を含める小さな調整があれば、キーポイントと完全に一致しますが、それ以外には実質的な変更は必要ありません。 **最終版(オリジナルから変更なし)** > ワシントン大学の研究者たちは光ファイバー分散型音響センサー(DAS)を用いて、従来の耕作と土壌圧縮が地下毛細管ネットワークを乱し、土壌が水分を保持できなくなり侵食に対してより脆弱になることを示しました。英国の農場で40時間にわたる地表運動データを記録し、低い地震波速度と高い湿度レベル(湿った土壌は音の伝搬を抑制する)との関連を明らかにしました。この研究では、軽から中程度の降雨下で圧縮レベルが異なる3つの耕作深さ(ノータイル、10 cm、25 cm)を比較しました。ハーパー・アドムズ大学の長期間耕作された列(ニューポート近郊)で実施され、結果は2024年3月19日に*Science*に掲載されました。研究は複数の財団とNERCグラントによって資金提供され、主筆者は現在中国科学院に所属しています。著者らはDASが農家により持続可能な耕作慣行を導く手助けになり、リアルタイム洪水警報、気候モデルの大気水量推定の精度向上、液化リスク評価による地震危険図の改善など、農業・天気予報・気候科学・インフラ計画に貢献すると示唆しています。

ARC‑AGI‑3(アーク・AGI・3) | そっか~ニュース