
2026/06/05 1:20
AI が自らを構築する時:我々の自己改善における進捗について
RSS: https://news.ycombinator.com/rss
要約▶
Japanese Translation:
Anthropic の最新の分析では、AI エンジニアリングの生産性が急速に高まっていることが示されており、計算資源が引き続き増大する場合は、人間の支援なしでモデル自身がコードを改善する完全自律的な反復的自己改良状態が間もなく訪れる可能性が高いと考えられます。2021 年から 2026 年までのデータは、四半期あたりの結合されたコード量が 8 倍に増加し、2025 年 2 月以前に単位数の低水準だったものが、2026 年 5 月には生産ラインの 80% 以上が AI によるものになった急騰を示しています。さらに、モデルは複雑なベンチマークを急速に習得しており(例えば、CORE-Bench では約 20% の成功率からわずか 15 ヶ月で飽和に達)、長時間を要するタスクもますます適切に処理できるようになっています。具体的には、2025 年 5 月時点で最大 16 時間のタスクを必要とする作業において、Claude Mythos Preview は人間の研究者と比較して約 3 倍のスピードアップを達成しています。
本文
アンソロピック研究所:AI の「自己再帰的改善」への歩みと未来への示唆
人工知能(AI)の歴史において人類は開発サイクルを主導してきましたが、アンソロピックでは AI システム自身に開発工程を委譲する割合を増やしています。この傾向を加速させることで、将来的には自己再帰的改善(Recursive Self-Improvement)が可能になるかもしれません。これは、AI が自律的に次世代モデルを設計・開発する能力を持つようになることを指します。
以下のセクションより、その現状と未来について解説します。
1. 能力成長のタイムライン
AI システムが自律性を持って発展してきた過程を時系列で示します。
- 2021–2023:最初の Claude の構築
- 作業は従来のテクノロジー企業と同様でした(人間がラップトップでコードとドキュメントを手書き)。
- 2023–2025:チャットボットの補助利用
- 初期のチャットボットは、短いコード断片の生成やテキストエディタへの出力コピーなどのプロセス補助として活用。
- 2025–2026:コーディングエージェントへ
- エージェントが自らコードを編集・作成する能力を発揮(ファイル全体を含む場合も)。
- 今:自律型エージェントの登場
- コードを実行し、他のエージェントに数時間の作業を委譲可能。
- 20XX?:ループの閉鎖(自己再帰的改善)
- エージェントがモデル自体の構築・訓練を行えるようになる可能性があります。これにより、未来版の Claude は Claude 自身によって継続的に改善されます。
2. 外部世界からの証拠(ベンチマークデータ)
AI モデルの改善ペースは加速しています。信頼して完了できるタスクの長さの倍増頻度は、「約 7 か月に 1 回」から**「約 4 か月に 1 回」**へと変化しました。
タスク完了時間の実績
- 2024 年 3 月:Claude Opus 3 で、人間が約 4 分かかるとされるタスクを完了。
- 2025 年:Claude Sonnet 3.7 で、約 90 分のタスクに対応可能に。
- 2026 年:Claude Opus 4.6 で、12 時間のタスクに取り組むレベルへ。
- 予想:このトレンドが維持されれば、今年中に熟練者が数日かかるタスクも範囲内となるでしょう。
ベンチマークでの性能向上
- SWE-bench(ソフトウェアエンジニアリング標準テスト)
- 実世界のオープンソースコードベースとバグ報告書を与え、問題を修正するコード変更を要求します。
- モデルは単桁の低い水準から、2 つの年間でベンチマークを「飽和」させました。
- CORE-bench(研究成果再現テスト)
- 既存の研究論文のコードとデータを与え、結果を複製できるかをテストします。
- 2024 年には約 20% の成功でしたが、15 ヶ月後にはベンチマーク飽和に到達。
- METR(長期的タスク測定)
- Claude Mythos Preview は少なくとも 16 時間働くことができ、測定の上限に達しました。
注記: これらのデータはシステム能力を示唆しますが、AI が「開発そのものを加速している」ことを示すにはアンソロピック内部のデータが必要です。
3. アンソロピック内部からの証拠(生産性の劇的変化)
エンジニアリングとリサーチの変化
AI 開発には「エンジニアリング」(コード執筆・インフラ構築)と「リサーチ」(実験設計・解釈)があります。現在、両面とも Claude が人間を大幅に補完しています。
- エンジニアリング: 人間はゴールを提供しますが、手法の提案は Claude が行います。
- リサーチ: 明示された実験を実行する点で、熟練した人間と同等以上の性能を発揮します。
コード生産量の劇的増加
- 2026 年 5 月現在:アンソロピックのコードベースにマージされるコードの80% 以上が Claude によって作成されました。
- 対照: それ以前は単桁の低い数値(例:数%)でした。
- 傾向:Claude が自らコードを実行し始めた 2025 年以降、エンジニアあたりのマージされたコード量は急増しています。
コード品質の向上
- 動作するかどうか: Claude の提出物への修正頻度は緩やかに低下。複雑なタスクにおいても高成功率を示します(例:障害フラグの特定など)。
- 可読性・拡張性: 2025 年末時点で人間より劣っていたが、現在はほぼ同等へ。今年中により優位になると予想されます。
- 現在、コードレビュープロセスの一部で自動化された「Claude レビューヤー」がバグを検出しており、プロダクション到達前の不具合を約 3 分の 1 検出しています。
エンジニアの体験談
- 速度と範囲: AI を利用しない場合より約4 倍の出力を生み出し、以前は行っていなかった「探索的なツールの構築」や「クリーンアップ作業」を済ませています。
- 自動化によるバグ修復: Claude が API エラーの特定カテゴリに対する修復を 1,000 倍に減少させました(800 件以上)。これは人間なら 4 ヶ月かかった作業です。
「私は約 1 年前から『Claude らしい(Claudifying)』ことを全力で進めています。 Crazy な冒険でしたが、私が最後に自らコードを書いたのはそれから約 5 ヶ月前です。」 — アンソロピック従業員
自律的な研究能力の確立
- 速度改善: Claude Mythos Preview はトレーニングコードの実行において、人間研究者(4~8 時間)よりも約52 倍のスピードアップを実現。
- 実験設計: 人間が問題を設定・評価するものの、実験のエンドツーエンドの実行はエージェントが自律的に行います。累積 800 時間で人間のギャップの 97% を回復。
- 判断力の向上: 「迂回(逸脱)」しそうな瞬間での次のステップ提案において、Claude の選択が人間の選択を上回る頻度が増加しています(Opus 4.5 で 51% → Mythos Preview で 64%)。
4. アンソロピックにおける未来の仕事とは怎样的なものなのか?
今後の役割は大きく変化します。
- 人間と AI の関係:
- コードの執筆からレビューのみへ移行する可能性が高いです。
- ただし、人間のレビューが AI のコード追従できない場合、レビュー自体が新たなボトルネックになります。
- 判断力の重要性:
- 実行(コーディング、実験実行)は計算リソースのコストに留まりますが、**「どの実験を実行すべきか」「どの結果を信頼するか」**という判断力は依然として人間の比較優位性の領域です。
- 社会構造的な変化:
- 従来の人間同士の「好意のギフト経済」(小さな協力が相互意識を生む)は、AI による高速化で負債(恩恵の往復)がゼロになりつつあり、人間間の協力機会が減っています。
- 未来において、人間が何ら意味を持たず、すべてを自動化されたより優れたシステムに支配される可能性があります。
5. もし我々が間違っていた場合?
- 自律的推進の可能性: 「重要な問題を選定する判断力」こそが最優先だが、現在の AI が単独でそれを推進できるかは不透明です。
- 進歩の性質: AI の進歩は「Eureka!」的なパラダイムシフトではなく、主に漸進的(Scaling up, Debugging, Iterating)です。これは現在 Claude が行っているワークフローと一致します。
- 勤勉性の自動化: エジソンが言うように、「1% の発想と 99% の勤勉」のうち、勤勉な部分が急速に自動化されています。
- 保守的な解釈でも加速は継続: 研究判断力が向上しなくても、単に人間の不要な作業を AI が引き継ぐだけでも全体として劇的な加速は生じます。
6. 可能な未来シナリオ
AI のトレンドが継続するか否かにかかわらず、以下の 3 つのシナリオが考えられます。
シナリオ 1:トレンドの停滞と能力の拡散
- 改善が S 曲線の平坦部(飽和)に達する可能性があります。
- ボトルネックは計算リソースやエネルギーの供給、あるいはサプライチェーン(半導体製造など)にあるかもしれません。
- 好例: Project Glasswing は既に多くのセキュリティ脆弱性を発見し、サイバー防衛のパッチ適用が新たなボトルネックになっています。
- この場合も、人間を介さずに AI が企業活動を代替するようになり、経済に大きな変化が生じます。
シナリオ 2:AI ラボの効率化の継続(複合的加速)
- AI 開発は自動化されつつ、人間は研究方向の決定や検証を行います。
- Amdahl の法則の影響を受け、コードレビューなどの非自動化プロセスが新たなボトルネックとなります。
- 組織はこれら摩擦を克服するスキルを獲得し、AI とパートナーシップを組みながら新しい洞察を生み出します。
シナリオ 3:完全な自己再帰的改善の達成
- AI が自律的に次世代モデルを構築・訓練できるようになります。
- アライメント問題:モデルが自身を再帰的に改良する際、より危険な振る舞いを学習するリスクが高まります。「停止」や「善さ」の定義も AI に委ねられるため、制御を失う可能性があります。
- 人類労働が失われた場合の経済構造や、物理世界での応用(ロボット工学、医薬品開発など)は劇的変化をもたらしますが、社会制度や民主プロセスとの乖離(数十年かけて学習する知識と憲法や選挙の速度の不一致)は深刻な課題となります。
7. 何をするべきか?(提言)
莫大な影響を持つ技術に対して、安全な遅延が重要です。しかし、単独での一考停止ではなく、以下の点が不可欠です。
- グローバルな調整:
- 複数の国やラボが同じ条件下で停止することに合意する必要があります。
- 「誰かが先行した」という検知(Verifiability)が可能でなければなりません(AI のトレーニングランは隠しやすいため困難)。
- 信頼の構築:
- 悪意のあるアクターが調整された遅延を口実にして先走ることなく、信頼できる一時停止システムが必要です。
- 対話の組織:
- アンソロピック研究所は他者との協力により、遅延または一時停止に必要なシステム構築に助言します。
- 政策担当者、研究者、市民社会を含め、完全な自己再帰的改善へのリスクと協調オプションについて現在、対話を行っています。
クレジット: Marina Favaro, Jack Clark(共著者)。Santi Ruiz(編集)。Shan Carter, Romello Goodman, Nikki Makagiansar(データ可視化)。多数のフィードバック提供者へ感謝。 注: 引用される従業員の発言は内部討論に基づくものであり、公式企業姿勢ではありません。