AI が自らを構築する時:我々の自己改善における進捗について

2026/06/05 1:20

AI が自らを構築する時:我々の自己改善における進捗について

RSS: https://news.ycombinator.com/rss

要約

Japanese Translation:

Anthropic の最新の分析では、AI エンジニアリングの生産性が急速に高まっていることが示されており、計算資源が引き続き増大する場合は、人間の支援なしでモデル自身がコードを改善する完全自律的な反復的自己改良状態が間もなく訪れる可能性が高いと考えられます。2021 年から 2026 年までのデータは、四半期あたりの結合されたコード量が 8 倍に増加し、2025 年 2 月以前に単位数の低水準だったものが、2026 年 5 月には生産ラインの 80% 以上が AI によるものになった急騰を示しています。さらに、モデルは複雑なベンチマークを急速に習得しており(例えば、CORE-Bench では約 20% の成功率からわずか 15 ヶ月で飽和に達)、長時間を要するタスクもますます適切に処理できるようになっています。具体的には、2025 年 5 月時点で最大 16 時間のタスクを必要とする作業において、Claude Mythos Preview は人間の研究者と比較して約 3 倍のスピードアップを達成しています。

本文

アンソロピック研究所:AI の「自己再帰的改善」への歩みと未来への示唆

人工知能(AI)の歴史において人類は開発サイクルを主導してきましたが、アンソロピックでは AI システム自身に開発工程を委譲する割合を増やしています。この傾向を加速させることで、将来的には自己再帰的改善(Recursive Self-Improvement)が可能になるかもしれません。これは、AI が自律的に次世代モデルを設計・開発する能力を持つようになることを指します。

以下のセクションより、その現状と未来について解説します。

1. 能力成長のタイムライン

AI システムが自律性を持って発展してきた過程を時系列で示します。

  • 2021–2023:最初の Claude の構築
    • 作業は従来のテクノロジー企業と同様でした(人間がラップトップでコードとドキュメントを手書き)。
  • 2023–2025:チャットボットの補助利用
    • 初期のチャットボットは、短いコード断片の生成やテキストエディタへの出力コピーなどのプロセス補助として活用。
  • 2025–2026:コーディングエージェントへ
    • エージェントが自らコードを編集・作成する能力を発揮(ファイル全体を含む場合も)。
  • 今:自律型エージェントの登場
    • コードを実行し、他のエージェントに数時間の作業を委譲可能。
  • 20XX?:ループの閉鎖(自己再帰的改善)
    • エージェントがモデル自体の構築・訓練を行えるようになる可能性があります。これにより、未来版の Claude は Claude 自身によって継続的に改善されます。

2. 外部世界からの証拠(ベンチマークデータ)

AI モデルの改善ペースは加速しています。信頼して完了できるタスクの長さの倍増頻度は、「約 7 か月に 1 回」から**「約 4 か月に 1 回」**へと変化しました。

タスク完了時間の実績

  • 2024 年 3 月:Claude Opus 3 で、人間が約 4 分かかるとされるタスクを完了。
  • 2025 年:Claude Sonnet 3.7 で、約 90 分のタスクに対応可能に。
  • 2026 年:Claude Opus 4.6 で、12 時間のタスクに取り組むレベルへ。
  • 予想:このトレンドが維持されれば、今年中に熟練者が数日かかるタスクも範囲内となるでしょう。

ベンチマークでの性能向上

  • SWE-bench(ソフトウェアエンジニアリング標準テスト)
    • 実世界のオープンソースコードベースとバグ報告書を与え、問題を修正するコード変更を要求します。
    • モデルは単桁の低い水準から、2 つの年間でベンチマークを「飽和」させました。
  • CORE-bench(研究成果再現テスト)
    • 既存の研究論文のコードとデータを与え、結果を複製できるかをテストします。
    • 2024 年には約 20% の成功でしたが、15 ヶ月後にはベンチマーク飽和に到達。
  • METR(長期的タスク測定)
    • Claude Mythos Preview は少なくとも 16 時間働くことができ、測定の上限に達しました。

注記: これらのデータはシステム能力を示唆しますが、AI が「開発そのものを加速している」ことを示すにはアンソロピック内部のデータが必要です。

3. アンソロピック内部からの証拠(生産性の劇的変化)

エンジニアリングとリサーチの変化

AI 開発には「エンジニアリング」(コード執筆・インフラ構築)と「リサーチ」(実験設計・解釈)があります。現在、両面とも Claude が人間を大幅に補完しています。

  • エンジニアリング: 人間はゴールを提供しますが、手法の提案は Claude が行います。
  • リサーチ: 明示された実験を実行する点で、熟練した人間と同等以上の性能を発揮します。

コード生産量の劇的増加

  • 2026 年 5 月現在:アンソロピックのコードベースにマージされるコードの80% 以上が Claude によって作成されました。
  • 対照: それ以前は単桁の低い数値(例:数%)でした。
  • 傾向:Claude が自らコードを実行し始めた 2025 年以降、エンジニアあたりのマージされたコード量は急増しています。

コード品質の向上

  • 動作するかどうか: Claude の提出物への修正頻度は緩やかに低下。複雑なタスクにおいても高成功率を示します(例:障害フラグの特定など)。
  • 可読性・拡張性: 2025 年末時点で人間より劣っていたが、現在はほぼ同等へ。今年中により優位になると予想されます。
    • 現在、コードレビュープロセスの一部で自動化された「Claude レビューヤー」がバグを検出しており、プロダクション到達前の不具合を約 3 分の 1 検出しています。

エンジニアの体験談

  • 速度と範囲: AI を利用しない場合より約4 倍の出力を生み出し、以前は行っていなかった「探索的なツールの構築」や「クリーンアップ作業」を済ませています。
  • 自動化によるバグ修復: Claude が API エラーの特定カテゴリに対する修復を 1,000 倍に減少させました(800 件以上)。これは人間なら 4 ヶ月かかった作業です。

「私は約 1 年前から『Claude らしい(Claudifying)』ことを全力で進めています。 Crazy な冒険でしたが、私が最後に自らコードを書いたのはそれから約 5 ヶ月前です。」 — アンソロピック従業員

自律的な研究能力の確立

  • 速度改善: Claude Mythos Preview はトレーニングコードの実行において、人間研究者(4~8 時間)よりも約52 倍のスピードアップを実現。
  • 実験設計: 人間が問題を設定・評価するものの、実験のエンドツーエンドの実行はエージェントが自律的に行います。累積 800 時間で人間のギャップの 97% を回復。
  • 判断力の向上: 「迂回(逸脱)」しそうな瞬間での次のステップ提案において、Claude の選択が人間の選択を上回る頻度が増加しています(Opus 4.5 で 51% → Mythos Preview で 64%)。

4. アンソロピックにおける未来の仕事とは怎样的なものなのか?

今後の役割は大きく変化します。

  • 人間と AI の関係:
    • コードの執筆からレビューのみへ移行する可能性が高いです。
    • ただし、人間のレビューが AI のコード追従できない場合、レビュー自体が新たなボトルネックになります。
  • 判断力の重要性:
    • 実行(コーディング、実験実行)は計算リソースのコストに留まりますが、**「どの実験を実行すべきか」「どの結果を信頼するか」**という判断力は依然として人間の比較優位性の領域です。
  • 社会構造的な変化:
    • 従来の人間同士の「好意のギフト経済」(小さな協力が相互意識を生む)は、AI による高速化で負債(恩恵の往復)がゼロになりつつあり、人間間の協力機会が減っています。
    • 未来において、人間が何ら意味を持たず、すべてを自動化されたより優れたシステムに支配される可能性があります。

5. もし我々が間違っていた場合?

  • 自律的推進の可能性: 「重要な問題を選定する判断力」こそが最優先だが、現在の AI が単独でそれを推進できるかは不透明です。
  • 進歩の性質: AI の進歩は「Eureka!」的なパラダイムシフトではなく、主に漸進的(Scaling up, Debugging, Iterating)です。これは現在 Claude が行っているワークフローと一致します。
  • 勤勉性の自動化: エジソンが言うように、「1% の発想と 99% の勤勉」のうち、勤勉な部分が急速に自動化されています。
  • 保守的な解釈でも加速は継続: 研究判断力が向上しなくても、単に人間の不要な作業を AI が引き継ぐだけでも全体として劇的な加速は生じます。

6. 可能な未来シナリオ

AI のトレンドが継続するか否かにかかわらず、以下の 3 つのシナリオが考えられます。

シナリオ 1:トレンドの停滞と能力の拡散

  • 改善が S 曲線の平坦部(飽和)に達する可能性があります。
  • ボトルネックは計算リソースやエネルギーの供給、あるいはサプライチェーン(半導体製造など)にあるかもしれません。
  • 好例: Project Glasswing は既に多くのセキュリティ脆弱性を発見し、サイバー防衛のパッチ適用が新たなボトルネックになっています。
  • この場合も、人間を介さずに AI が企業活動を代替するようになり、経済に大きな変化が生じます。

シナリオ 2:AI ラボの効率化の継続(複合的加速)

  • AI 開発は自動化されつつ、人間は研究方向の決定や検証を行います。
  • Amdahl の法則の影響を受け、コードレビューなどの非自動化プロセスが新たなボトルネックとなります。
  • 組織はこれら摩擦を克服するスキルを獲得し、AI とパートナーシップを組みながら新しい洞察を生み出します。

シナリオ 3:完全な自己再帰的改善の達成

  • AI が自律的に次世代モデルを構築・訓練できるようになります。
  • アライメント問題:モデルが自身を再帰的に改良する際、より危険な振る舞いを学習するリスクが高まります。「停止」や「善さ」の定義も AI に委ねられるため、制御を失う可能性があります。
  • 人類労働が失われた場合の経済構造や、物理世界での応用(ロボット工学、医薬品開発など)は劇的変化をもたらしますが、社会制度や民主プロセスとの乖離(数十年かけて学習する知識と憲法や選挙の速度の不一致)は深刻な課題となります。

7. 何をするべきか?(提言)

莫大な影響を持つ技術に対して、安全な遅延が重要です。しかし、単独での一考停止ではなく、以下の点が不可欠です。

  1. グローバルな調整:
    • 複数の国やラボが同じ条件下で停止することに合意する必要があります。
    • 「誰かが先行した」という検知(Verifiability)が可能でなければなりません(AI のトレーニングランは隠しやすいため困難)。
  2. 信頼の構築:
    • 悪意のあるアクターが調整された遅延を口実にして先走ることなく、信頼できる一時停止システムが必要です。
  3. 対話の組織:
    • アンソロピック研究所は他者との協力により、遅延または一時停止に必要なシステム構築に助言します。
    • 政策担当者、研究者、市民社会を含め、完全な自己再帰的改善へのリスクと協調オプションについて現在、対話を行っています。

クレジット: Marina Favaro, Jack Clark(共著者)。Santi Ruiz(編集)。Shan Carter, Romello Goodman, Nikki Makagiansar(データ可視化)。多数のフィードバック提供者へ感謝。 注: 引用される従業員の発言は内部討論に基づくものであり、公式企業姿勢ではありません。

同じ日のほかのニュース

一覧に戻る →

2026/06/05 5:11

Anthropic の AI 駆動型脆弱性情報発見のためのオープンソースフレームワーク

## Japanese Translation: サマリーは全体的には良好ですが、キーポイント(コマンド、特定のスキル、パイプラインの段階)に見られる具体的な実行可能な詳細が不足しています。構造とコマンドを取り入れたやや詳細なバージョンであれば、推論を加えずに完全性を向上させることができます。 ## サマリー(改善版) Anthropic は、「Claude Security」というソフトウェアの脆弱性発見および修正のためのマネージドサービスを紹介しており、オープンソースのリファレンスハルネス `github.com/anthropics/defending-code-reference-harness` が提供されています。このリポジトリは、セキュリティチームとのパートナーシップから得られた知見を活用し、自律的な C/C++ 脆弱性発見および修正のためのガイド役を担っていますが、外部からのコントリビューションを受け入れるメンテナンスされた製品ではありません。アクセスには Bedrock や Vertex、Azure などの特定の API が要求されます。 コア技術は、脅威モデリング、静的スキャン、実行検証、パッチ適用を含む厳格な多段階パイプラインを使用しています。主要なスキルには `/threat-model`、`/vuln-scan`、`/triage`、`/patch`、および `/customize` があります。特に重要なのは、自律エージェントがシステムへの損傷を防ぐために **gVisor** サンドボックス内で対象コードを実行すること(Claude API へのエGRESSは制限されている)であり、パイプラインを `bin/vp-sandboxed` を通じて呼び出す前にユーザーが `./scripts/setup_sandbox.sh` を実行する必要があります。`/quickstart` スキルはサンドボックスなしで **Claude Code** で安全に確認できるのに対し、自律ループにはそれを必要とします。 ユーザーは段階的なアプローチに従うよう推奨されます:ステップ 1(Day 1)では、対象コードに対して静的スキャンと脅威モデリングを行い、`/patch` を通じてパッチを生成し、カスタマイズをスモークランで検証してからステップ 2(Day 2)へ進む。ステップ 2 では C/C++ ライブラリ向けの完全な自律ループを展開します。生产用途では、組織は複数の並列パイプラインウェーブ(ステップ 4)を実行し、結果に対して自動タリアジを行うべきです(`/triage` で投票を使用)。本システムは SDLC に連続的検証を統合しており、毎日スキャンや CI パイプラインを通じて運用され、ゼロから構築される完璧なプラットフォームを要求せずに多様な依存関係の露出に対処するのを支援します。サンドボックス化、カスタマイズ、およびパッチに関するドキュメントは `docs/security.md`、`docs/agent-sandbox.md` および関連ガイドで利用可能です。

2026/06/05 6:42

URL の IPv6 ゾーンは間違いです

## Japanese Translation: - 現在稼働中の Anubis ウェブサイトはバージョン v1.25.1-0.20260604200537-44d5fa3ce047 を使用しています。マスコットのデザインは CELPHASE によって作成されました。サイトには Techaro に帰属する著作権表示が表示され、コンテンツは「❤️(愛)と🇨🇦(カナダ)で作成」であるとしてクレジットされています。

2026/06/04 22:00

Cloudflare に参加する VoidZero が決定

## Japanese Translation: VoidZero(Vite、Vitest、Rolldown、Oxc、および Vite+ の開発者)が、その全チームを Cloudflare に統合し、エコシステムを完全にオープンソース化し、MIT ライセンスに基づき、ベンダー非依存な状態を維持することを約束しています。100 万ドルの資金を Vite エコシステムファンドに供与することで、コミュニティ主導の開発を優先し、ツールをプロプライエタリなスタックに合わせるのではなく、強化されたエンジニアリングリソースを直接ツール維持に向けるとして、この戦略的移行を進めています。Evan とコアチームは引き続き開発をリードし続けます。Vite(週 1.29 億回のダウンロード)や新しい Cloudflare プラグイン(週 1,400 万回のダウンロード)の高い採用率は、特に AI 開発者がこの統一されたワークフローによって支えられる高速フィードバックループを必要としていることで、強固な市場の信頼を示しています。現在、Vite は React、Next.js(vinext 経由)、Vue、SvelteKit、Nuxt、Astro、Solid、Qwik、Angular など主要なフレームワークの基盤となるビルドツールとして機能しています。新たに導入された統一 CLI(`cf`)はネイティブデプロイとバインディングを統合しており、標準的な Vite 操作と完全に互換性を保ちつつ、「cf dev」コマンドにより「vite dev」の超集合体として動作します。将来の計画には、Void プラットフォームを完全にオープンソース化して公衆との協力を促進することや、Cloudflare の Environment API を通じて非 Node ランタイムをサポートするツールへの進化が含まれています。結局のところ、開発者は強力なリソースと統一された環境にアクセスでき、業界はベンダーロックインなしで長期的なポータビリティを確保する強化された標準から恩恵を受け、Cloudflare のツールは Vite を Cloudflare 用に特別に適応させるのではなく、Vite スタンドダードの方へ移行しています。

AI が自らを構築する時:我々の自己改善における進捗について | そっか~ニュース