**自律的な数学研究へ向けて**

2026/02/16 3:35

**自律的な数学研究へ向けて**

RSS: https://news.ycombinator.com/rss

要約

Japanese Translation:

概要:
Aletheiaは、先進的なGemini Deep Thinkフレームワークに基づいて構築された数学研究エージェントであり、自然言語で解決策を生成・検証・洗練することができます。国際数学オリンピック問題から博士課程レベルの演習まで、完全自律的に問題解決を行い、人間の介入なしに新しい結果を生み出します。その有効性は、新規の推論時スケーリング法則と複雑な数学文献をナビゲートするための広範なツール使用に依存しています。
著者(Tony Feng、Trieu H. Trinh、Garrett Bingham、Dawsen Hwang、Yuri Chervonyi、Junehyuk Jung、Joonkyung Lee、Carlo Pagano、Sang‑hyun Kim、Federico Pasqualotto、Sergei Gukov、Jonathan N. Lee、Junsu Kim、Kaiying Hou、Golnaz Ghiasi、Yi Tay、YaGuang Li、Chenkai Kuang、Yuan Liu、Hanzhao Lin、Evan Zheran Liu、Nigamaa Nayakanti、Xiaomeng Yang、Heng‑Tze Cheng、Demis Hassabis、Koray Kavukcuoglu、Quoc V. Le、Thang Luong)は3つのマイルストーンを提示しています:

  1. 人間の介入なしに生成されたAI研究論文(Feng26)で、算術幾何学における固有重みについて扱っています。
  2. 人間とAIが協力して作成した論文(LeeSeo26)で、相互作用する粒子の独立集合に対する境界を証明しています。
  3. 半自律的評価(Feng et al., 2026a)はBloom’s Erdos Conjecturesデータベースから700件のオープン問題を対象とし、4つの質問については完全に自動で解決策を提示しています。
    今後、著者らはAI支援数学における自律性と新規性指標を公式化し、「人間‑AIインタラクションカード」を導入して透明性を高め、すべてのプロンプトとモデル出力を公開する予定です。これらの進展は学術的発見を加速させ、手動検証作業を削減し、査読におけるAI責任の新たな基準を設定することで、研究者・出版社、および厳密な数学的証明を必要とするあらゆる分野に利益をもたらす可能性があります。

本文

著者
トニー・フェン、チエウ・H・チリン、ガレット・ビンガム、ダウセン・フワン、ユリ・チェルヴォニ、ジューニョク・ジュング、ジョンキョン・リー、カルロ・パガノ、サンヒョン・キム、フェデリコ・パスカロット、セルゲイ・グクフ、ジョナサン・N・リー、ジュンス・キム、カイヤイン・ホウ、ゴルナズ・ギアシー、イ・テイ、ヤガオング・リ、チェンケイ・クアン、ユアン・リュウ、ハンズァオ・リン、エヴァン・ジェラン・リュウ、ニガマ・ネヤカントゥ、シャオメン・ヤン、ヘンツェ・チョン、デミス・ハッサビス、コレイ・カヴクソグル、クォック・V・リー、トアン・ルオン

PDF / HTML(実験的)を表示


要旨

基盤モデルの最近の進歩により、国際数学オリンピックで金メダル相当の推論システムが実現されました。しかし、競技レベルの問題解決から専門研究へ移行するには、膨大な文献を網羅し、長期的な証明構築を行う必要があります。

本稿では、Aletheia を紹介します。これは自然言語でソリューションを反復的に生成・検証・改訂していく数学研究エージェントです。具体的には、オリンピックレベル以上の難問に対応する Gemini Deep Think の高度版と、新しい推論時スケーリング法則、および数学研究の複雑さを乗り越えるための集中的なツール使用が組み込まれています。

Aletheia がオリンピック問題から博士課程レベルの演習、そして AI 支援による数学研究におけるいくつかの重要マイルストーンで示した能力を以下に示します:

  1. Feng26 – 整数幾何学における構造定数(エンビートウェイト)計算を人間の介入なしに AI が行った研究論文。
  2. LeeSeo26 – 相互作用粒子系(独立集合)の境界を証明する際の人間-AI 協働を示す研究論文。
  3. 大規模半自律評価(Feng et al., 2026a)では、Bloom のエルドス予想データベースから 700 の未解決問題に対し、4 つの問いに AI が自律的に解答した。

AI と数学の進展を一般に理解してもらうために、AI 支援結果の自律性と新規性を標準化し、透明性を担保する「人間-AI インタラクションカード」の概念を提案します。最後に、人間と AI の協働について考察し、すべてのプロンプトとモデル出力を以下の URL で公開しています。


提出履歴
送信者:トアン・ルオン [メールを見る]

  • v1 – 2026年2月10日火曜 18:50:15 UTC (2,611 KB)
  • v2 – 2026年2月12日木曜 18:27:29 UTC (2,612 KB)

同じ日のほかのニュース

一覧に戻る →

2026/02/16 6:54

OpenAI に入社いたします。

## Japanese Translation: ** ## Summary: 著者は、OpenAIに参加する計画を発表しつつ、自身のオープンソースプロジェクト **OpenClaw** の開発を継続することを示しています。OpenAI のリソースとスポンサーシップと連携することで、ユーザーに優しく安全な AI エージェントをより広い層へ届けることを目指しています。彼らのプレイグラウンド・イニシアティブはすでに世界的な注目を集めており、アクセスしやすいツールの価値を証明しました。サンフランシスコで主要研究所と会議を行い、最先端モデルへの早期アクセスを得た一週間後、著者は OpenAI の高度な技術とオープンソース基盤を組み合わせることが責任ある AI 展開に不可欠だと考えています。 今後、OpenClaw は多様なモデルをサポートし、コミュニティ協力を奨励するファウンデーションへ進化します。著者は OpenAI の最前線研究チームに直接貢献すると同時に OpenClaw を独立して維持し、急速な商業スケールよりもインパクトのある製品に焦点を当てます。この二重アプローチは、非技術的ユーザーに強力なエージェントを提供し、開発者やデータ所有者に柔軟な基盤を構築させ、AI 業界を研究と実世界応用を橋渡しするより強固なオープンソース基盤へとシフトさせる可能性があります。

2026/02/16 2:12

LT6502:6502ベースの自作ラップトップ

## Japanese Translation: ``` ## Summary この設計は、8 MHz 65C02プロセッサを中心に構築されたコンパクトでバッテリー駆動のコンピュータを概説しています。 メモリ:46 KB RAM(0x0000–0xBEAF)はゼロページ、BASIC RAM、および Compact Flash バッファに分割されます;EhBASIC 2.22p5 と eWozMon およびブートストラップコードは ROM の 0xC000〜0xFFFF に配置されています。 周辺機器:タイマー/IO 用の 65C22 VIA(0xBFCO)、Compact‑Flash コントローラ(0xBFBO)、ビーパー(0xBFA0)、内部キーボード(0xBFEO)、コンソール FTDI インターフェース(0xBFF0)があります。 ディスプレイ:9″ RA8875 パネル(800×480)に内蔵フォントとシンプルなグラフィックスがあり、開発時には 4.3″ デモユニットも使用されました。 インターフェース:`OUTK` コマンド用の 8文字 OLED キーボード、USB‑C 充電/電源供給、シリアルコンソールアクセス、および将来のボード用に 0xBE00 に拡張スロットがあります。 バッテリー:**10 000 mAh** パック(USB‑C で電源・充電)。 ファームウェアは、BEEP、CIRCLE、CLS、COLOUR、DIR、ELIPSE、LINE、LOAD、MODE、OUTK、PLOT、SAVE、SQUARE、および WOZMON などのカスタム EhBASIC コマンドを追加します。 開発マイルストーン: - PCB スキーマティクスは 2025‑11‑12 に完成。 - 電源投入と基本機能は 2026‑01‑05 に達成。 - CF コントローラとビーパーは 2026‑01‑09 に動作確認済み。 - ディスプレイ統合は 2026‑01‑16 に完了。 - ファームウェア拡張(SAVE/LOAD、グラフィックス)は 2026‑02‑08 後から進行中。 - ケース組立は 2026‑02‑14 に完了。 このプロジェクトは、BASIC 開発者と教育者向けに低価格で携帯性の高いプラットフォームを提供し、レトロコンピューティングコミュニティおよび組込みシステム教育への影響が期待されます。 ```

2026/02/16 5:53

**GNU Pies ― プログラム起動と実行監視**

## Japanese Translation: **改訂された概要** Pies は軽量なスーパーバイザーで、外部プログラム(「コンポーネント」)を起動・監視し、自動的に再起動します。各コンポーネントはフォアグラウンドで実行され、Pies は起動時に設定ファイルからそのリストを読み込みます。コンポーネントの起動後、Pies はバックグラウンドプロセスとして継続し、終了を監視します。デフォルトでは予期せず停止したコンポーネントを自動的に再起動します。また、終了時にメール通知を送信したり別のプログラムを呼び出すなど、代替アクションを設定することも可能です。GNU ライセンスで提供される Pies は init デーモン(ブート時に最初に起動されるプロセス)として機能できます。この役割では、従来の `/etc/inittab` ファイルまたは Pies 独自の GNU スタイル設定を通じて構成を提供でき、古い init システムよりも柔軟性が高くなります。制御インターフェースは既に管理対象コンポーネントに対して広範囲な監視と管理機能を提供しています。

**自律的な数学研究へ向けて** | そっか~ニュース