
2026/01/09 1:16
**デジタル・レッドクイーン:LLMとの共演によるコアウォールにおける対抗プログラム進化**
RSS: https://news.ycombinator.com/rss
要約▶
Japanese Translation:
(欠落していた詳細を組み込んだもの)**
要約
本研究は、大規模言語モデルが Digital Red Queen (DRQ) アルゴリズムを用いて自己プレイにより、ますます堅牢な「Core War」戦士を自律的に進化させることを示しています。各ラウンドで新たに生成された戦士は、以前のすべての戦士を打ち破るよう設計され、実験ではラウンド数が増えるほど進化した戦闘機が未見の人間設計対戦相手を扱う能力が向上することが確認されています—ただし、テスト対戦相手に直接訓練は行われていません。
主な発見点:
- 収束進化: 異なる初期戦士から始まる独立した DRQ 実行は、形質(挙動)は収束しますが、遺伝子型(ソースコード)では収束しないことが示されました。これは、異なる実装から機能的に類似した解決策が生じることを意味します。
- Core War はサンドボックス: 1984 年のチューリング完全な競技プログラミングゲームである Core War は、アセンブリ風 Redcode プログラムが共有メモリ空間上で対戦するため、Red‑Queen ダイナミクスと敵対的進化を研究するための極めて変動的かつダイナミックな戦場を提供します。これはサイバーセキュリティやその他の領域に関連しています。
- 示例戦士: 代表的な DRQ 生成例として、Ring Warrior Enhanced v9 と Spiral Bomber Optimized v22 が挙げられ、それぞれ単一プログラム内で異なる戦略的アプローチを示しています。
- オープンリソース: 本論文は arXiv で公開されており、併せて GitHub 上にコードベースが公開されています。これにより、戦士の挙動をさらに探究し可視化することが可能です。
著者らは、この自律的なレッドチーミング手法をゲーム以外へ拡張できると示唆しています――AI システムの強化、医薬品探索、市場エコシステムモデリング、および人工生命研究への応用です。また、Sakana AI が The AI Scientist、LLM‑Squared、Shinka‑Evolve、Automating the Search for Artificial Life、ALE‑Agent などのプロジェクトを基盤にした AI 主導型発見プラットフォームを構築するためにエンジニアを募集していることも指摘しています。
この要約はすべての主要ポイントを保持し、新たな推測を加えず、明確な主旨を提示し、曖昧または混乱を招く表現を排除しています。
本文
デジタル・レッドクイーン:LLMを用いたコアウォーにおける対立的プログラム進化
2026年1月8日
「最適なコードの生存」
コアウォーでは、戦士(warriors) と呼ばれる組み込み風プログラムが仮想コンピュータ上で支配を争います。戦士は高度な戦略―ターゲット付き自己複製、データ爆撃、大規模マルチスレッド化―を駆使して相手をクラッシュさせ、機械を掌握します。
- 上段パネル:デジタル・レッドクイーン(DRQ)アルゴリズムが発見した戦士同士の対決。各 DRQ ラウンドでマルチエージェントシミュレーションに1 つの新規戦士が追加されます。
- 下段パネル:ラウンド数が増えるほど、LLM 主導の進化はより堅牢な戦略を発見します。現れた挙動は、生物学的進化と類似し、エージェントは絶えず適応して変化する脅威に対抗し生存しなければならないという点で共通しています。
コアウォーが Turing 完全環境であり、コードとデータが同一のアドレス空間を共有するため、このプロセスは自己修正的ダイナミクスに混沌とした形をもたらします。
要約
コアウォーは 1984 年に導入された競争型プログラミングゲームです。戦士 と呼ばれる対決プログラムが仮想コンピュータ内で支配権を争います。開発者は Redcode という専門的なアセンブリ言語でコードを書きます。本稿では、大規模言語モデル(LLM)が駆動する対立的進化競争が、静的ベンチマークではなく成長する対戦相手の履歴に継続的に適応していく様子を探ります。
主な発見
- ダイナミックな対立プロセスは、ますます一般的な戦略へと進化します。
- 興味深い収束進化が生じます:独立したコード実装が類似の高性能挙動に収束します。
- コアウォーは「レッドクイーン」ダイナミクスを人工システムで研究するためのサンドボックスとして機能し、サイバーセキュリティなど現実世界の対立的環境で AI エージェントが進化する様子を安全かつ制御された形で解析できます。
詳細は技術報告(ウェブペーパー、arXiv)および GitHub で公開したコードをご覧ください。
DRQ により生成された戦士の例
- Ring Warrior Enhanced v9
- Spiral Bomber Optimized v22
これらは、DRQ が単一プログラム内で質的に異なる戦略を合成し、一般的に高性能な戦士を生み出す能力を示しています。コメントは LLM によって生成されています。
進化した戦士のシミュレーション
当社のサンドボックス型コアウォー環境では、ユーザーはマウスカーソル周辺の戦士の Redcode を対話的に可視化できます。詳細は GitHub をご覧ください。
序章
人間は他種との絶え間ない競争を通じて進化してきました。この競争は、ウイルスや細菌から個人・企業・国際レベルまであらゆる規模で続いています。AI システムが増えるにつれ、それらもまたこの競争環境に入り込み、新たな形態の進化ダイナミクスを生み出します。
これらのダイナミクスを研究するため、LLM を用いてコアウォーで互いに対戦するプログラムを進化させます。コアウォーは、仮想コンピュータ内の共有メモリブロック「Core」で行われるゲームです。Redcode で書かれた各戦士は、相手をクラッシュさせつつ自身のプロセスを存続させようとします。シミュレーションは戦士間で交互に実行され、一度に一命令ずつ処理します。攻撃は、DAT コマンド(無効な命令)を相手が占有するメモリスロットへ書き込むことで、次回実行時にクラッシュさせる仕組みです。
当社の方法:デジタル・レッドクイーン(DRQ)
レッドクイーン仮説 は、生物が常に進化し続けなければ、絶えず変化する競争相手に対抗できないと提唱します。この概念は対立的 Arms Race に自然に適用できます。
DRQ はこの考えを計算機上で具現化したものです:
- 初期戦士から開始。
- それを打ち負かす第二戦士を進化させる。
- 第三戦士は最初の二つに対して優位性を持つように進化させ、というサイクルを繰り返します。
各新しい戦士は、すべての前身によって定義される変化する環境に適応しています。DRQ は独自のアルゴリズムではなく、既存のマルチエージェント・セルフプレイ手法をコアウォー向けに最小限に実装したもので、継続的共進化ダイナミクスを分離し研究するために設計されました。
結果
- 一般的な頑健性:DRQ が多くのラウンドを経ると、戦士は見たことのない人間設計戦士にも強固になります。これはテストセットで訓練しなくても堅牢なプログラムを生成する安定した手段です。
- 収束進化:独立した DRQ 実行(それぞれ異なる初期戦士で開始)は、徐々に類似した挙動を持つ戦士へと収束します。収束は遺伝子コードではなく 表現型(行動)レベルで起こります。
これは生物学的な収束進化と同様で、鳥やコウモリの翼、蜘蛛とヘビの毒など異なるメカニズムを通じて同一機能が独立に発展する現象です。進化は機能的要求によって類似した解へと導かれます。
議論
レッドクイーンダイナミクスから収束進化が出現することは、DRQ とコアウォーが対立的 Arms Race を研究する有望なプラットフォームであることを示唆します。得られた洞察は、サイバーセキュリティなど実世界の環境で LLM がどのように進化しうるかを理解し、「レッドテーピング」を事前に自動化する手法として活用できる可能性があります。
コアウォーは自己完結型プログラムが人工機械上で動作し、人工言語を使用しているため、生成されたものがサンドボックス外で実行されることはありません。これによりリスクの高い対立的ダイナミクスを安全な環境で探求できます。
今後の課題
- エージェントが同時に共進化する、より豊かな設定を探索し、実世界の並列適応集団に近づける。
- DRQ のようなセルフプレイループを人工生命、ドラッグデザイン、市場エコシステムなど他の競争型マルチエージェントシミュレーションへ適用する。
- 将来の AI 進化を制御し、進化的 Arms Race の科学を理解するために洞察を活用する。
ご参加ください
Sakana AI は AI 主導の発見の最前線に立っています。本研究以外にも The AI Scientist、LLM‑Squared、Shinka‑Evolve、人工生命探索の自動化、ALE‑Agent などのプロジェクトを開発中です。エンジニアを募集しており、モデル開発を本番化するチームに加わっていただけます。
キャリア機会: [リンク]