
2026/02/16 3:35
**自律的な数学研究へ向けて**
RSS: https://news.ycombinator.com/rss
要約▶
Japanese Translation:
概要:
Aletheiaは、先進的なGemini Deep Thinkフレームワークに基づいて構築された数学研究エージェントであり、自然言語で解決策を生成・検証・洗練することができます。国際数学オリンピック問題から博士課程レベルの演習まで、完全自律的に問題解決を行い、人間の介入なしに新しい結果を生み出します。その有効性は、新規の推論時スケーリング法則と複雑な数学文献をナビゲートするための広範なツール使用に依存しています。
著者(Tony Feng、Trieu H. Trinh、Garrett Bingham、Dawsen Hwang、Yuri Chervonyi、Junehyuk Jung、Joonkyung Lee、Carlo Pagano、Sang‑hyun Kim、Federico Pasqualotto、Sergei Gukov、Jonathan N. Lee、Junsu Kim、Kaiying Hou、Golnaz Ghiasi、Yi Tay、YaGuang Li、Chenkai Kuang、Yuan Liu、Hanzhao Lin、Evan Zheran Liu、Nigamaa Nayakanti、Xiaomeng Yang、Heng‑Tze Cheng、Demis Hassabis、Koray Kavukcuoglu、Quoc V. Le、Thang Luong)は3つのマイルストーンを提示しています:
- 人間の介入なしに生成されたAI研究論文(Feng26)で、算術幾何学における固有重みについて扱っています。
- 人間とAIが協力して作成した論文(LeeSeo26)で、相互作用する粒子の独立集合に対する境界を証明しています。
- 半自律的評価(Feng et al., 2026a)はBloom’s Erdos Conjecturesデータベースから700件のオープン問題を対象とし、4つの質問については完全に自動で解決策を提示しています。
今後、著者らはAI支援数学における自律性と新規性指標を公式化し、「人間‑AIインタラクションカード」を導入して透明性を高め、すべてのプロンプトとモデル出力を公開する予定です。これらの進展は学術的発見を加速させ、手動検証作業を削減し、査読におけるAI責任の新たな基準を設定することで、研究者・出版社、および厳密な数学的証明を必要とするあらゆる分野に利益をもたらす可能性があります。
本文
著者
トニー・フェン、チエウ・H・チリン、ガレット・ビンガム、ダウセン・フワン、ユリ・チェルヴォニ、ジューニョク・ジュング、ジョンキョン・リー、カルロ・パガノ、サンヒョン・キム、フェデリコ・パスカロット、セルゲイ・グクフ、ジョナサン・N・リー、ジュンス・キム、カイヤイン・ホウ、ゴルナズ・ギアシー、イ・テイ、ヤガオング・リ、チェンケイ・クアン、ユアン・リュウ、ハンズァオ・リン、エヴァン・ジェラン・リュウ、ニガマ・ネヤカントゥ、シャオメン・ヤン、ヘンツェ・チョン、デミス・ハッサビス、コレイ・カヴクソグル、クォック・V・リー、トアン・ルオン
PDF / HTML(実験的)を表示
要旨
基盤モデルの最近の進歩により、国際数学オリンピックで金メダル相当の推論システムが実現されました。しかし、競技レベルの問題解決から専門研究へ移行するには、膨大な文献を網羅し、長期的な証明構築を行う必要があります。
本稿では、Aletheia を紹介します。これは自然言語でソリューションを反復的に生成・検証・改訂していく数学研究エージェントです。具体的には、オリンピックレベル以上の難問に対応する Gemini Deep Think の高度版と、新しい推論時スケーリング法則、および数学研究の複雑さを乗り越えるための集中的なツール使用が組み込まれています。
Aletheia がオリンピック問題から博士課程レベルの演習、そして AI 支援による数学研究におけるいくつかの重要マイルストーンで示した能力を以下に示します:
- Feng26 – 整数幾何学における構造定数(エンビートウェイト)計算を人間の介入なしに AI が行った研究論文。
- LeeSeo26 – 相互作用粒子系(独立集合)の境界を証明する際の人間-AI 協働を示す研究論文。
- 大規模半自律評価(Feng et al., 2026a)では、Bloom のエルドス予想データベースから 700 の未解決問題に対し、4 つの問いに AI が自律的に解答した。
AI と数学の進展を一般に理解してもらうために、AI 支援結果の自律性と新規性を標準化し、透明性を担保する「人間-AI インタラクションカード」の概念を提案します。最後に、人間と AI の協働について考察し、すべてのプロンプトとモデル出力を以下の URL で公開しています。
提出履歴
送信者:トアン・ルオン [メールを見る]
- v1 – 2026年2月10日火曜 18:50:15 UTC (2,611 KB)
- v2 – 2026年2月12日木曜 18:27:29 UTC (2,612 KB)