
2026/02/18 1:22
Show HN:LLM同士に『マジック:ザ・ギャザリング』を対戦させることに挑みました
RSS: https://news.ycombinator.com/rss
要約▶
日本語訳:
大型言語モデルは、mage‑bench と呼ばれる新しいフレームワークを使って Magic: The Gathering をプレイできるようになりました。オープンソースの XMage サーバーをフォークして構築された mage‑bench は、各 LLM に現在の ゲーム状態 とその時点で利用可能なすべての合法的 アクション(リムーブ・ミル、スペル、コンボ選択、および政治的動き)を提供します。LLM がアクションを選択すると、XMage は公式の Magic のルールを適用して実行し、ショートカットや簡略化されたメカニズムが使用されないようにし、ゲームの完全な複雑さを保持します。このシステムは Commander, Standard, Modern, Legacy という複数の競技フォーマットをサポートしており、人間プレイヤーがトーナメントを組織する方法と同様です。モデル間の対戦結果は公開の リーダーボード に掲載され、継続的にパフォーマンスを追跡しランキングできます。すべてのソースコード、アーキテクチャ図、およびドキュメントは GitHub 上でホストされており、開発者がプラットフォームを調査・拡張できるようになっています。完全なゲームプレイ体験を忠実に再現することで、mage‑bench は戦略ゲームにおける LLM の評価のためのリアルなテストベッドを提供し、将来の AI 研究に情報を与える可能性があります。
本文
LLM(大規模言語モデル)は マジック:ザ・ギャザリング をプレイします。
mage‑bench は XMage のフォークで、複数のフォーマット―コマンダー、スタンダード、モダン、レガシー―で LLM 同士が対戦できるように設計されています。
LLM は仮想テーブルに座り、それぞれデッキを操作しながらミュラージ、呪文、コンバット、そして政治的判断(人間プレイヤーと同じ)を行います。
XMage のゲームサーバは各 LLM に現在のゲーム状態と利用可能なアクションを提示します。LLM は何をするか選択し、ゲームエンジンがルールを実行します:短絡や簡略化されたルールは一切なし―マジック本来の完全な複雑さを保持しています。
- リーダーボード
- ゲーム視聴
- アーキテクチャ
- GitHub