
2026/05/09 11:41
ChatGPT 5.5 Pro に最近触れた体験談
RSS: https://news.ycombinator.com/rss
要約▶
日本語翻訳:
加算数論における重要な進展として、ChatGPT 5.5 Pro が人間の数学的指導なしにわずか 1 時間で長年にわたる未解決の研究問題を独自に解決し、博士号品質の結果を達成した。AI は新たな上限・下限を証明し、制限付き和集合(restricted sumsets)に対する従来の手法を大幅に上回る専用集合を構成することに成功した。当初はモーメント曲線に関与する非効率な幾何級数構築法を使用していたが、そのアプローチは Bose–Chowla (1938) および Singer (1963) から借用された多項式サイズの既成技術を活用するように精錬された。これらの構築法は、扱いやすい(多項式的な)要素を持つ k 重和集合の全サイズを達成し、以前の方法が指数関数的に大きな数が必要だったのと対照的である。重要なのは、専門家の審査員が AI 生成のプレプリントを概念レベルおよび行レベルの双方においてほぼ間違いなく正しいと検証したことである。このブレークスルーは従来の博士課程教育に挑戦するものであり、今や大規模言語モデルによって基本的な問題さえも自律的に解決可能になったのである。したがって、業界は基本タスクの解決からより高次な協力へと焦点を移行させる必要があり、研究者は AI 単独で導き出せない結果の証明だけでなく、これらの強力なツールと実際に連携して研究の進展を遂げるパートナーシップを行う必要がある。数学的発見の未来は、おそらく人間の努力よりも人間と AI の相補性によって決定的になる可能性がある。
本文
私たちが今、大規模言語モデル(LLM)の数学的能力に対する評価を上方修正し続ける必要があります。私は幸いなことに ChatGPT 5.5 Pro にアクセスすることができたため、同様の向上修正を行いましたが、その成果は PhD レベルの研究論文を作成する能力を持っていました。私はそれに対して真に深刻な数学的な入力を与えることは一切ありませんでした(約 1 時間弱で)。
背景を説明しましょう。広く報道されている通り、LLM は現在、研究レベルの問題を解決することが可能であり、Thomas Bloom 氏の優れたウェブサイト上にリストアップされているエルデシュ問題のいくつかも解決済みです。当初はこれに冷笑することができました。「解答」と呼ばれるものが、多くの場合、すでに文献に存在する答えを発見したり、既知の結果から容易に導出できることだけを示すものに過ぎないからです。しかし、徐々に冷笑はおさまり始めました。よりこの分野に関与している他の数学者たちが語っているメッセージは、「LLM は、ある理由(問題が十分に注目されていない場合など)で人間の数学者に見落としてしまった簡単な証明方法を見つける可能性が高まった」という点にあります。逆に、LLM が巧妙な証明を考案したことに感銘を受けると最初思ったような問題においても、詳しく調べてみると、その証明の事前事例が存在することが多いことが判明します。つまり、LLM が単に既存の知識を組み合わせているだけで、本当に独創的なアイデアを持っているわけではないと、自分を慰めようとする余地はまだ十分に残っています。それがどれほど「安心材料」となるかはここでは議論しませんが、極めて健全な人間の数学者の活動の一つがまさに既存の知識と証明技術の組み合わせであるという事実は無視できません。
私は少し異なるアプローチを試みました。少なくとも組合せ論においては、比較的新しい組合せ論的パラメータを調査し、そこから自然にいくつかの疑問が生じる論文が多数存在します。問いかけられることのできる問題の数が膨大であるため、著者は各問いについて 1〜2 週間も考える時間を費やすことができないでしょう。したがって、少なくともいくつかの問題はそれほど難しくないと期待できます。これは、初歩的研究を行う数学研究初心者にとって非常に貴重な問題源となります(彼らを鼓舞する公式に開かれた問題を解くという経験です)。かつてはそうした価値がありましたが、現在は基準が上がっているようです。単に誰かが問題を提示するというだけでは不十分で、「LLM がそれを解決できないほど難しい」必要があるのです。
いずれにせよ、約 1 週間前には ChatGPT 5.5 Pro を、Mel Nathanson 氏による論文『加算数論の問題におけるダイバーシティ、公平性、包含のための問題』で提起された一連の問題に対峙させる実験を行いました。Nathanson 氏は、後になって極めて流行し、影響力を帯びた定理や問題に関心を持つというremarkable な記録を持っています。そのおかげで、彼は非常にタイミング良く執筆されたため、極めて影響力の高い教科書シリーズを著しました。この論文では、いくつかの他の問題についても関心を喚起させようとしています。そのうちいくつかについて以下に簡単に説明します。
$A$ が整数集合であるとすれば、その和集合 $A+A$ は ${a+b : a,b \in A}$ と定義されます。正の整数 $h$ に対して、$h$ 重和集合($h$-fold sumset)$hA$ は ${x_1 + \dots + x_h: x_i \in A}$ と定義されます。Nathanson は、集合 $A$ の大きさを与えたとき、$hA$ の可能な大きさについて関心を寄せています。この目的のために、すべての整数 $m$ からなる集合 $S_h(t)$ を定義することができます(ここで、ある集合 $A$ が $|A|=t$ かつ $|hA|=m$ を満たすように存在する全体の組 $m$ の集合)。
まず考えられる簡単な問いは、「$S_h(t)$ は何ですか?」という単純なものですが、それは答えが容易に得られます。$h=1$ の場合は、$t$ と $t^2$ の間のすべての整数からなる集合です。これは容易な演習問題として証明でき、$h=2$ の場合には $2 \le S_2(t) \le t+t^2$ が成り立ちます(つまり、この範囲内のすべての大きさが実現可能であることを示しています)。しかし一般に、$S_h(t)$ は最小値と最大値の間のすべての大きさを取りうるわけではありません。そして現在、$S_h(t)$ の完全な記述は得られていません。
別の自然な問いとして考えられるのは、「与えられた $|hA|$ を実現するためには、直径(集合の最大要素と最小要素の差)をどの程度大きく取る必要があるか」という問題で、これがまさに ChatGPT が介入した部分です。(もちろん、$|hA|$ の大きさは必ず $S_h(t)$ に属していなければなりません。)Nathanson は、すべての $t$ に対して ${1, \dots, n}$ の部分集合 $A$($|A|=t$ かつ $|2A|$ が与えられた大きさを満たす)が存在することを示し、その上界 $n$ を改善できるか問いかけました。ChatGPT 5.5 Pro は議論に 17 分 5 秒を要した後、「二次の上界を与える構築(construction)」を提供しました。これは明らかに最適であることがわかります。そして、やや散漫した LLM 特有の文体でその論証を記述しましたが、私はこれを典型的な数学的プレプリント形式の LaTeX ファイルとして記述するよう依頼しました。2 分 23 秒後、それを提出し、その後自分で論証が正しいかを確認する時間を過ごしました。
Nathanson の論証と ChatGPT の背後にある基本的なアイデアは、「与えられた大きさの和集合を持つ集合を得るためには、Sidon 集合(和集合の大きさが最大となるような集合;これは通常の定義とは少し異なるが、本議論において是最も単純に使いやすい)と等差級数から構成するのが有用である」という点にあります。さらに微調整のために、等差級数の近くに追加のポイントを取り入れることもできます。それらのパラメータを弄り回すと、任意の大きさの集合を得ることができることがわかります。Nathanson はこのように議論を展開していません(彼の論文では第 5 項として与えられていますが)。私は彼の詳細な確認は行っていませんが、彼の論証を解きほぐすと、実質的には Sidon 集合がべき乗 $2$ のものから構成されていることがわかります。ChatGPT は、より効率的な Sidon 集合を使用することでこの改善を実現しました。Sidon 集合で直径を二次関数にできることはよく知られています。(なぜ Nathanson が最初からそれを採用しなかったのかと問われれば、私はそれは彼の帰納的構造を再記述した後に明らかになる「当然のアイデア」だったと考えます。ChatGPT はそれを行ったのでしょうか。それは言いにくいことです)
次に、私は ChatGPT に、和集合の大きさを見るのではなく、制限和集合(restricted sumset;$|A+A \cap {x+y : x,y \in A, x \neq y}|$ と定義される)の大きさを考える類似の問題に対処できるか尋ねました。予想通り、それは何らの苦労もなく遂行できました。両方の結果を単一のノートとして記述し、一定の重複を避けるよう指示しました。ご興味があれば、そのノートをこちらでご覧になれます。
そして私は、一般的な $h$ に対してそれが可能か問いました。私がこれを「面白い何か」ができるかどうかについてはあまり楽観的ではなかったのが事実です。なぜなら、$h=2$ の証明は Erdős と Szemerédi による結果(我々が正確にどの大きさを作ればよいかを知っているという事実に本質的に依存している)を大きく用いているからです。もし $S_h(t)$ がわからないのであれば、仮想的な集合 $A$($|A|=t$ かつ $|hA|$ が与えられた大きさを持つ)を出発点として、直径が小さい同じ性質を持つ集合を構築せざるを得ないようです。実際には、その困難さを取り除く方法についてはまだ私自身も知りません(これは私の数学的貢献がゼロであることを示すため言及しているに過ぎず、プロンプトも特に巧妙なものは何も行っていません)。ただし、Nathanson は自身の論文の中で、MIT の学生で研究員である Isaac Rajagopal 氏のremarkable な論文に触れ、彼はどのようにしてその困難を取り除いたのかを明らかにしました。彼は各固定された $h$ に対して、$n$ が $t$ への指数関数的依存関係を証明しました。
前の段落についてはこのままでおきますが、Isaac はその後、それが本当の困難ではないと私に説明してくれました。彼の論法は $t$ が十分に大きい場合に $S_h(t)$ の完全な記述を与えるものであり、固定された $h$ に対して多項式の依存関係を証明したい場合、「$t$ が十分に大きい」と仮定することは明らかに可能です。本当の困難さは、与えられた和集合の大きさを持つ集合を構築することが著しく複雑であることにあります。これは必然的であり、なぜなら多項式の次数は $h$ に伴って増加するため、集合を定義するために必要なパラメータもさらに多くなる必要があるからです。
いずれにせよ、ChatGPT にとっての課題は問題を从头 scratch から解決することではなく、Isaac Rajagopal の論法を緊密化(tighten up)するかどうかを見極めることでした。以下がその経過です。
16 分 41 秒後、ChatGPT は指数関数 $t$ から多項式 $t$ への改善を上界に据えるという論法を持って归来しました。
私はそれをプレプリント形式にも記述するよう求めましたが、さらに 47 分 39 秒かかりました。
そのプレプリントは私が読むのが困難なものだったでしょう(Rajagopal の論文を仔細に読む必要があるため)。しかし私はこれを Nathanson 氏へ送り、同氏が Rajagopal 氏に転送し、「おそらく正しく見える」と返信されたのです。
ChatGPT も Rajagopol も、さらに推し進めて多項式限界を得るためには何が必要かについて少し思索しました。そこで私は欲張りになって ChatGPT にそれを試すよう依頼しました。
13 分 33 秒後、そのような論法が存在することへの楽観的な見解を示しつつ、いくつかの技術的ステートメントをチェックする必要があると述べました。
私がそれらをチェックするよう求めました。
9 分 12 秒後にチェックが完了したという報告を受け、これについてもプレプリント形式で記述するよう依頼しました。
31 分 40 秒後、「プレプリント」が完成しました。こちらをご覧ください。
Isaac Rajagopal がこれを検討し、「ほぼ間違いなく正しい」と宣言しました。彼の意図は行間レベルだけでなく、概念のレベルでもそうであったことが明らかです。
Isaac の ChatGPT の達成度に関する評価
数回のプロンプトだけで、ChatGPT は $S_h(t)$(すぐに定義します)の上界を $t$ への指数関数から多項式へ改善しました。最初の改善である「$t$ への指数関数から $\sqrt{t}$ への指数関数」は私の作業の定型的な修正でしたが、多項式への変更は非常に印象的です。これを実現するため、ChatGPT は私はもし数週間~2 ヶ月程度思索した後に得るだろうような、非常に誇りに感じられるような独自かつ巧妙なアイデアにたどり着きました。それは自分の証明で用いた類似の方法を使用して見つけ、証明しました(所要時間は 1 時間未満)。私の目標は、そのアイデアを CS メジャーの友人も数学メジャーの友人も消化可能な形で説明することです。
$S_h(t)$ を制限する問題は、私がかつて Duluth REU(Undergrads Research Experience)プログラムで取り組んだ $\mathcal{A}_h$ の決定という問題と密接に関連しています。特に、$\mathcal{A}_h$ は $t$ 個の整数からなる任意の集合 $A$ が選べるような可能となる $h$ 重和集合の大きさ $m$ の集合です。一方、$S_h(t)$ はそのような $t$ 要素を持つ集合 $A$ を使用してすべての $m$ の値を実現できる最小の $t$ です。私は昨夏、$t$ が十分に大きい場合に $\mathcal{A}_h$ を明示的に特徴付けるために、不可能であると排除できないすべての大きさを実現するように $A$ を構築しました。したがって、$S_h(t)$ は私の構築を最適化することによって上界付けられます。
これらの集合 $A$ は、解析が容易なより小さい部分集合を結合することで構成されました。そのいくつかは以下の幾何級数です: $$G_k = {2^k, 2^{k+1}, \dots, 2^{k+r}}$$ 様々な $r$ と $k$ の値に対してです。残念ながら、$G_k$ および $G'_k$ の要素は $k$ について指数関数的に大きいのです。そこで私は ChatGPT(Tim を介して)、「これらの幾何級数と同様な和集合の大きさを持つが、元素は $t$ についての多項式の大きさしか含まないような $t$ 個の要素からなる集合が存在するか?」と尋ねました。私はそれが可能かどうか、またそのような集合をどのように構築すればよいか全く知らなかったのです。ChatGPT は答えてくれました。それは「多項式区間に押し込められた半幾何級数」のように振る舞う $P_k$ と $Q_k$ の集合を構築しました。これは直感的ではないことです。ここでは、$P_k$ と $Q_k$ の構築について述べる前に、それらが再現時の持つ $G_k$ および $G'_k$ の和集合の大きさの重要な性質について説明します。
与えられた集合 $A$ に対して、集合 $S \subset A^h$ を $h$-dissociated set($h$-分離集合)と呼ぶことにします。これは、 $$a_1 + \dots + a_h = b_1 + \dots + b_h$$ という等式において、$a_i, b_i \in S$ となる解決策はすべて「自明」なものに限られることを意味します。「自明」というのは、一方の式の要素が他方の式の要素の再順列である場合のみを指します。もし $S$ が大きさ $t$ の $h$-dissociated set なら、$S^h$ の要素は、反復を許して $S$ の要素から $t$ つ選ぶことと一一对応します。「スターアンドバー」法を使えば、そのような解決策は $\binom{t+h-1}{h}$ 通りあることがわかります。これは大きさ $t$ を持つ集合の $|hA|$ における最大値です。したがって、別の定義として「$h$-Sidon 集合とは、条件 $|hA| = \binom{|A|+h-1}{h}$ を満たす集合 $S$」と呼ぶことができます(Tim が議論した Sidon 集合はまさに $h=2$ の場合です)。
より具体的にするために、(1) で $k=0$ と仮定しましょう。すると $G_0$ は 2-set ですが、任意の $j > i+1$ に対して $$2^i + 2^j = 2^{i+1} + 2^{j-1}$$ という関係式が存在するため、3-set ではありません。特に、そのような関係式は非常に多くのものです。したがって、$G_0$ は 2-set ですが 3-set ではなく、上記の関係式から $G_0$ には約 $t^2$ の関係式があります。これは容易に検証でき、$|3G_0|$ が $t$ に対する 3 次関数であることがわかります。要約すると、以下の性質を見ました: (a) $G_k$ は $h$-dissociated set です。 (b) $|hG_k|$ は $t$ についての線形関数です。 (c) $P_k$ は $h$-dissociated set です。 (d) $|hP_k|$ は $t$ に関する二次関数です。
ChatGPT は、元素がすべて $t$ についての多項式の大きさしか持たない $t$ 個の要素を持つ集合 $P_k$ と $Q_k$ を見つけ出すことができました。これらは (a) から (d) の性質を満たしますが、その構築には $h$-dissociated sets が用いられています。これは次のように定義される集合です: $$a_1 + \dots + a_h = b_1 + \dots + b_h$$ の唯一の解決策は「自明」なものであり、つまり ${a_1, \dots, a_h} = {b_1, \dots, b_h}$ で一方の側が他方の再順列である場合です。$h=2$ の場合は、$|S| \approx \sqrt{n}$ であり、したがって $n$ に対して多項式的な大きさを持つ $h$-dissociated set $S$ を構築することが可能です。有限体を用いたそのような $S$ の構築は Singer (1938) や Bose–Chowla (1963) までさかのぼり、別添 1 に記述されています。以下のように定義します: $$P_k = { x^2 + kx : x \in \mathbb{F}_p }$$ および $$Q_k = { x^3 + kx : x \in \mathbb{F}_p }.$$
後付けではありますが、私は $P_k$ と $Q_k$ の構築についての直観を持っています。(2) および (3) にあるすべての関係式は、$a+b=c+d$ 形式の関係式の 1 つまたは 2 つを結合することで形成されています。$G_0$ および $G'_0$ にはそのような約 $t^2$ の関係式があり、同様に $P_k$ と $Q_k$ にも約 $t^2$ の関係式があります。$P_k$ と $Q_k$ ではこれよりも低い次数の他の関係式はあまりありません(なぜならそれらは $h$-dissociated 集合だからです)。したがって、$P_k$ と $Q_k$ は幾何級数列の対比となる半分の 2 次関係を包含しながら、低次の関係は極めて少ないという特徴を持っています。
これにより、(a) から (d) がそれぞれ $G_k$ および $G'_k$ の代わりに $P_k$ と $Q_k$ で成り立つことがわかります。具体性のために $k=0$ と $n=p$ と仮定すると、$P_0$ は $h=2$ において (4) と同じような自明でない関係を含むことはなく、したがって 2-set です(ただし 3-set ではありません)。これは以下の関係式によるものです: $$2x^2 + k(2x) = (x+1)^2 + k(x+1) + (x-1)^2 + k(x-1)$$ ある範囲内の任意の $x$ に対してです。もし $n=p$ とするならば、$|3P_0|$ が $t$ に対して線形であることが検証できます。特に、(a) および (b) は $G_k$ の代わりに $P_k$ を使い、線形関数は類似のものに置き換えて成り立ちます。同様に $Q_0$ は 2-set ですが、ある範囲内の任意の $x$ に対して以下の関係式によるため 3-set ではありません: $$3x^2 + k(3x) = (x+1)^3 + k(x+1) + \dots$$ もし $n=p$ とすれば、$|3Q_0|$ が $t$ に対して二次的であることが検証できます。同様の方法で、(c) および (d) は $G'_k$ の代わりに $Q_k$ を使い、二次関数は類似のものに置き換えて成り立ちます。
私は後に追って動機付けることができますが、ChatGPT が秩序 $h$ までの関係を制御するために $h$-dissociated sets を利用するというアイデアは非常に巧妙に感じられます。私の知る限り、このアイデアは完全に独創的です。
ChatGPT の構築から $m$ の期待される値を得るという証明は、私が $G_k$ および $G'_k$ をそれぞれ $P_k$ と $Q_k$ に置き換えた後で、私が構築した集合 $A$ が可能なすべての $m$ の値を実現する私の証明と非常に類似しています。(a) から (d) の性質は、この証明で用いられた $G_k$ および $G'_k$ (あるいは $P_k$ と $Q_k$)の多くの重要な性質を捉えています。最終的な構築では、ある限界間のすべての $m$ 値に対して、等差級数と 1 つの点との和である別の集合と組み合わせることで、$P_k$ と $Q_k$ (あるいは私の論文における $G_k$ と $G'_k$)を結合します。直感的には、$P_k$ と $Q_k$ は大きな和集合を持ち、等差級数は小さな和集合を持つため、これらを組み合わせることで中程度の大きさの和集合を実現できることが考えられます。ただし、この証明は非常に複雑で、私の論文第 4 節と ChatGPT プレプリント全体に占領されています(別添 2 では $t$ が十分に大きい場合について、ChatGPT の構築の詳細を算出しています)。 $$S_h(t) \le C t^{1 + h/2}.$$
比較のために、$S_h(t)$ が少なくとも $t$ のオーダーであることは容易に確認できますが、実際の値は未確定です。別添 3 では、私の論文と ChatGPT プレプリントの対応関係の詳細を記述しており、両方を読む方にとって有益です。
最後に、Tim にこのブログへの寄稿を許可してくださったことに対して深く感謝を表します。私が arXiv に投稿した加算数論に関する論文が、Tim によって選ばれて ChatGPT 5.5 Pro に導入されたという偶然にまだ驚いておりいます。
Tim: これが生体数学研究に意味するもの
私は ChatGPT が 2 時間未満で見出した成果の水準を、組合せ論 PhD の完全に妥当な章として判断します。Isaac のアイデアに大きく依存していたため、これは驚異的な結果とはみなされませんが、確かにそれらのアイデアの本質的で非自明な拡張です。PhD 学生がそのような拡張を見つけるには、Isaac の論文を仔細に読み込み、最適化されていない箇所を探すなどして、彼のアルジェブラ技術などを理解するには時間を相当かける必要があります。
私にとって、初歩的な PhD 学生を研究訓練させること(これは常に困難でした——私がしばしば幸運で、すぐに「わかった」というような生徒を持っていて、どの意味においても訓練が必要ないという場合を除く)は、さらに困難になっています。なぜなら、誰かが始めたのを助ける一つの明らかな方法は、比較的穏やかそうに見える問題を提示することだからです。LLM はそのような「穏やかな問題」を解決できるレベルに達しているならば、これはもう選択肢ではなくなります。数学への貢献の下位閾値は、もはや誰も証明していない何かを証明するだけでなく、LLM が証明できない何かを証明することに変わります。
ただしこの発言は二つの観点から限定されます。第一に、初歩的な PhD 学生は LLM を使用する選択肢を持っているという明白な点です。したがってタスクは潜在的に容易化しており、「LLM が証明できない何か」を証明するのではなく、「LLM と協力して LL M が単独では管理できない何か」を証明する問題です。私は最近、LLM がゲームチェンジングのアイデアを持っていない(まだ)ながら有用な貢献をした数多くのような協働を行いました。
第二の点は、私が述べたことのどれくらいが数学の他の分野に一般化するかはわからないということです。組合せ論は非常に問題志向であり、質問から始めて遡るか、順方向に進んでもその時常に問題意識を持って考えます。他の分野では順方向の推論(アイデアの円環から始まり、どこへ向かうか見てみる)が強調されることもあります。これを成功させるためには、興味深い観察と無意味な観察を見極める方法が必要であり、LLM がそのような点でどのような性能を示すかが明確ではありません。
もちろん、私が言及しているのは現在の LLM に関するものです。しかし、それらは急速に発展しており、私のコメントが数ヶ月以内に古くなることはほぼ確実です。また、これらの発展は数学的研究の手法、特に新規参入者への導入方法に劇的な影響を与えることもほぼ確実です。来年度から PhD を開始する人は 2029 年に終了します( earliest )。その時には、数学において研究を行う意味は完全に認識できないほど変化しているでしょう。
私は以前、数学の研究を行いたいと興味を持っている人々から、「これでも意義があるのか」と疑問を持つ人のメールを時々受けます。私の見解については議論がありますが、さらにの発展に対して大きく変わる可能性があります。私の見方は、数学の問題に挑むこと自体に大きな価値があるが、特定の定理や定義と永遠に自分の名前を結びつけるような興奮を楽しむ時代の終わりには近いかもしれないというものです。もしあなたが数学を行う目的が「不死者」と同様の何らかの不死を得ることだとしたら、それは長続きしないことを理解しておくべきです——あなただけでなく、誰にとってもそうでしょう。思考実験:もし数学者が LLM と長い議論を持ち、数学者は有用なガイド役を果たしたが、LLM がすべての技術的作業を行い主たるアイデアを持ったら、私たちはそれを数学者の主要な業績として評価するでしょうか?私はそう考えません。
では、難しい数学問題を解決することに意味があるのでしょうか?一つのアナワンは、答えが既に知られている問題でも解決することは非常に満足感があることです。しかし、人生の数年間をそのような特異な活動に費やすには十分ではないと思います。より良い回答は、他の人々の解答を読むだけでは得られない、問題解決プロセスそのものへの洞察を得られることであり、それは専門分野において特にそうであるということです。これの帰結として、難しい問題を自ら解決した人は、AI の助けを借りて問題を解決するスキルで格段に優れている可能性があり、同様に優秀なプログラマーは「バイブコーディング」(vibe coding)で優れ、基本的な暗算を理解している人は電卓を使うことに熟練しており(特に答えがおかしいと感じることに敏感です)。数学は高度な転用可能スキルのであり、これは研究レベルの数学にも当てはまります。数学で研究を行うことで、1 世代前の同様の人々が得ていた報酬と同じものを受け取ることはできないかもしれませんが、これから経験する世界において非常に良好に自己を準備できる可能性が高いのです。
別添 1 (Isaac)
我々は $|S| \approx n^{1/2}$ となる $h$-dissociated set $S$ を構築する。これは Bose–Chowla (1963) の Sidon 集合の構築に対する極めて微細な修正であり、この論文から学んだものである。何らかの理由により、GPT プレプリント(Lemma 3.1)は moment curves を用いた異なる、より非効率的な構築を使用している。
$p$ を素数とし、$k$ を整数とし、$\mathbb{F}_q$を $q=p^k$ の要素を持つ有限体とし、$\mathbb{F}_p$ 上の $\mathbb{F}_q$ の生成元となる $\alpha$ を固定する(これにより $x \mapsto \alpha x$ は原始要素による乗算に等しい)。以下の要素からなる集合を定義する: $$S = { \alpha^i : i = 0, \dots, q-2 }.$$ すると、各要素 $s \in S$ は対数をとることで一意の $j$ に対応する。さて、(4) の形の係数が $\mathbb{Z}$ に属する加法関係は、$\alpha$ のべき乗を用いて再定義される: $$\sum c_i s^i = \sum d_j s^j.$$ $\alpha$ は $\mathbb{F}_p$ 上の次数 $k$ の拡大であり、$\mathbb{F}_q$ を $\mathbb{F}_p$ 上で生成するため、これは $\alpha$ が次数 $< q$ の $\mathbb{F}_p[x]$ の非ゼロ多項式をみたさないことを意味する。したがって、(6) の両側は $\alpha$ に対する多項式として同一であり、(4) の加法関係は自明である。ゆえに、$S$ は $h$-dissociated であり、もちろんいくつかの要素を切り捨てて $|S|$ を大きさ $n$ にまで縮小できる。
別添 2 (Isaac)
$t_1, t_2$ を定数として選び、$t_1 + t_2 > t$ とする(私の論文では任意に $t_1 = t_2 = t/2$ を選んだ)。(5) の二つの集合をそれぞれ $A_1$ と $A_2$ と呼ぶ。$\mathcal{M}$ は $|hA| = m$ を満たす整数 $m$ の集合を表す。私の論文と同様に、$|hA|$ が期待される大きさを達成するように $A$ を構築するには、以下の四種類の集合を組み合わせる: $$A_{i,j} = { x + i \cdot t_1 + j \cdot t_2 : x \in A_i, y \in A_j }.$$ この構築が複雑である必要があるのは、少なくとも $\binom{t}{h}$ 多くの集合を作成する必要があるからである。これを行うために、ドメイン $[0, t_1]$ の中で $t_1$ パラメータ $u_1, \dots, u_{t_1}$ と、ドメイン $[0, t_2]$ の中で $t_2$ パラメータ $v_1, \dots, v_{t_2}$ を変化させる。$t_1$ をやや大きく $t/2$ より大きくとることで、上記の構築は $\binom{t}{h}$ 個の異なる集合を与える($t$ は任意に小さくできる)。したがって、もし上記のパラメータの一つを除去して他の変更しない場合、この構築はもはや $\binom{t}{h}$ 多くの集合を作成しなくなる。対照的に、Nathanson の $h=2$ の構築では、Sidon 集合、等差級数、および追加の値を組み合わせ、等差級数の大きさおよび追加値の範囲($O(1)$ のサイズ)を変化させるだけで $t(t+1)/2$ の集合を作成する。
$\binom{t}{h}$ の集合 $A_{i,j}$ (それぞれ $A_i = P_i + Q_i$ として与えられ、$t_1$ 値の $i$ と $t_2$ 値の $j$ に対応)を Sidon 集合と組み合わせたい。別添 1 より、すべての $k$ に対して、直径 $O(k^2)$ を持つ $h$-dissociated set $R_k$ が存在する。$P_i$ および $Q_j$ の構築を用いて、各 $A_{i,j}$ ($|A_{i,j}| \approx t$)をとることができる。$\mathcal{B}k$ を基底ベクトル $e_1, \dots, e_k$ を持つものとする。$A{i,j}$ を結合するためには、$M$ を以下のように定義する: $$M = \bigcup_{k} (A_{i_k, j_k} + \mathcal{B}_k).$$ 私の Lemma 4.9 と同様に、この構築は生成関数の積 $\prod (1+z^{a+b})$ が成立することを保証し、これは両方の論文(私の論文と GPT プレプリント)で使用される同一式である(これらの生成関数の定義についてはそれぞれの論文を参照)。GPT プレプリントの標準的な Lemma 2.3 より、$M$ は順序 $h$ の Freiman-isomorphic な $\mathbb{Z}$ の部分集合に同型である。したがって、$t$ が十分に大きい場合(構築全体はこの点のために依存しており、私の論文と同じ理由がある)、 $$S_h(t) \le C t^{1 + h/2}.$$
別添 3 (Isaac)
私の論文第 4.2 節では、異なるより単純な構築を使用して、小さな $m$ の場合に $|hA| = m$ を満たす $\mathcal{M}$ に属する値を実現する集合 $A$ を構築する。これらの集合 $A$ は $\mathbb{Z}$ の部分集合であり、すべての元素が $t$ について多項式的大きさを持つことを意味する。これは GPT プレプリント第 5 節で観察される。
私の論文第 4.3 節では、多くの成分($P_k$ および $Q_k$ を含む)を組み合わせる構築を実行する。これは GPT プレプリントの Section 2, 3, 4, および 6 に対応する。この節には多くの移動部があり、第 4.3.1 で概観を与える。
第 4.3.2 では、異なる成分を組み合わせていく方法について説明し、「不連続結合(disjoint union)」と呼ぶ構築を使用するとともに、集合 $A$ の和集合の大きさを管理する道具として生成関数 $G_A(z)$ を導入する。これは GPT プレプリントの Section 2 および 4 に対応する。
第 4.3.3 では、各成分集合($P_k$ (Lemma 4.15) および $Q_k$ (Lemma 4.17) を含む)の生成関数を計算する。これは GPT プレプリントの Section 3 と 6.1 に対応する。特に、$G_{P_k}(z)$ は Lemma 3.3 で、$G_{Q_k}(z)$ は Lemma 3.4 で計算される。これらの生成関数が計算されると、残りの証明は私の論文と GPT プレプリントにおいてほぼ同一である。
第 4.3.4 では、私が構築したすべての集合 $A$ を範囲させると、$|hA|$ の値が $\mathcal{M}$ のすべての要素を仮定することを示すためにすべてを組み立てる。鍵となるアイデアは、$|hA|$ のすべての値の集合が区間を形成し、かつ $m$ よりも小さい数および $m$ に等しい数を包含することを示すことにある。