AI の状況を示すグラフ（2026 年）

Japanese Translation:

2026年のスタンフォード AI アレックスレポートは、モデル開発において民間企業が決定的な優位性を確立したことを明らかにしており、主要リリースの90%以上を民間企業が担うようになり、過去には学術界が主導していた状況から大きく変化している。米国における前例のない5810億ドルの投資と、2021年以降に世界計算能力が30倍に増加したことを原動力としており、市場はNvidiaのようなハードウェア大手や中国の産業ロボットリーダー企業に大きく依存している。「Humanity's Last Exam」などのベンチマークでの breakthrough に加え、AI システムはアナログ時計を読むなどの基本的な視覚タスクでも依然として苦労しており（一部のモデルでは約8.9% の精度に留まるなど）、技術的な制約が残っている。この技術的急成長は労働市場を再形成し、初級ソフトウェア職での減少を招きつつ、中途キャリア職は安定化しており、失業率の上昇の中で作業員がスキルアップを迫られている。世論は地域によって異なる；欧州や南米では AI の利点に對してより楽観的になりつつある一方、政府規制への信頼については米国および一部の欧州で最も低い水準である。今後、業界の優位性と計算能力の拡大は、現在の推移に基づくと2026年4月まで続きそうだ。

主導的な AI モデルの能力は引き続き加速的に向上しており、OpenAI や Anthropic を含む最大の AI 企業들도本年後半にかけて IPO を目視している。しかしながら、AI に対する懐疑や反感は引き続きくすぶり続け、一部の状況では沸点を超えつつある。特に米国においては、地方自治体が新たなデータセンターの開発に対する規制、あるいは outright な禁止に着手し始めている。これらの動向を追跡するのは困難ではあるが、スタンフォード大学のヒューマン・セントラルド人工知能センター（HAI）が刊行する 2026 年版「AI インデックス」はそれを果たしている。この報告書は 400 ページを超す規模であり、ベンチマークスコアから投資動向、世論調査に至るまで多角的な視点から AI を捉える数十のデータポイントとグラフを収めている。以前と同様に（2021 年〜2025 年までの当社の Coverage も参照されたい）、我々は報告書を精査し、2026 年の AI の現状を要約する主要なトレンドを抽出した。

米国企業が AI モデル開発でリード
過日の decade にわたり AI モデルのリリースにおいて米国が主導的役割を果たしてきたことは、2025 年を含め以前と同様に真実である。エポック AI（Epoch AI）の研究によると、2025 年には米国の組織によって 50 の「注目すべき」モデルがリリースされた。一方で、中国勢はこの差を縮めてきている。

注目すべきモデルのほとんどは産業分野内で開発されたものであり（学術機関や政府機関とは対照的に）、エポック AI は 2025 年に産業系から 87 の注目モデルリリースを追跡したのに対し、他の源泉からはわずか 7 つしか確認されていない。これは長期的な主要なトレンドである。産業系でリリースされたモデルは現在、注目すべきモデルの 90 パーセント以上を占めており、2015 年には約半分、2003 年にはゼロだったと対照的である。

中国がロボティクス分野でリード
米国の企業が最も多数の注目 AI モデルをリリースした一方で、ロボットの導入においては中国が同様に明確な優位性を示している。国際ロボット連盟（IFR）のデータによると、中国は 2024 年に 295,000 台の産業用ロボットを導入し、日本が約 44,500 台、米国が 34,200 台を導入した。

世界の AI 計算能力は 2022 年以来毎年 3.3 倍に成長
最新のスタンフォード AI インデックス報告書には、AI インフラ拡大に関する目を引く数字が多く含まれているが、エポック AI の持つ総 AI 計算容量の計測値がそれらを凌駕する。Nvidia の H100e の計算能力を基準として示されたこのグラフでは、世界の AI 計算能力は 2022 年以降、毎年倍以上に増加していることがわかる。総 AI 計算容量は、追跡が始まった 2021 年以来 30 倍に伸びている。Nvidia は今回の拡大で最大便益を得ており、その GPU が現在世界の総 AI 計算容量の 60 パーセント以上を占めている。また、Amazon や Google（自社 AI 向けハードウェアを開発している企業）がそれぞれ第 2・第 3 の順位を収めている。

AI モデルのトレーニングによる温室効果ガス排出量は巨大
スタンフォードの AI インデックスは以前から AI トレーニングによる二酸化炭素排出量を指摘しており、この問題は引き続き憂慮すべき方向に進展している。報告書によると、xAI の Grok 4 といった最新の最先端大規模言語モデル（LLM）をトレーニングするだけでも 72,000 トン以上の炭素換算排出量が生じると推定されている。これは以前の見積もりから大幅な増加である。OpenAI の GPT-4 は 5,184 トン、Meta の Llama 3.1 405B は 8,930 トンと推計されていた。AI インデックス実行委員会の共同ディレクターを務めるレイ・ペロールド氏は「これらの数字は推計値であり、慎重に解釈すべきだ」と警告している。「特に Grok の場合、公共メディア（フォーブス記事など）、xAI の声明、その他の検証不可能なソースから推測された入力を大きく依存しており、一定の不確実性が残っている」と述べた。一方で、ペロールド氏は「エポック AI は独自に Grok 4 の排出量を大幅に高く、約 140,000 トンの CO₂と推定している」とも指摘している。

AI インference（推論）からの排出量も引き続き増加しており、結果はモデルによって異なる。報告書では、最も非効率的なインフェレンスを持つモデルの排出量は、最も効率的なものの 10 倍以上と推定されている。DeepSeek の V3 モデルは「中程度の長さ」のプロンプトに応じる際に約 23 ワットの電力を消費すると推計され、Claude 4 Opus は約 5 ワットだった。

LLM は急速に新たなベンチマークを破っている
AI モデルの能力は過去十年間で驚異的な速度で向上し、上記グラフのように進展がさらに加速している。特にマルチモーダル LLM は、新たなベンチマークが生み出される pace にほぼ同速でそれを制覇しつつある。エージェント型 AI（Agentic AI）では最も顕著な進歩が見られる。チャートの右端の 2 つの急勾配の直線は、自律的なコンピューター利用を評価する OSWorld ベンチマークと、自律的なコーディングを評価する SWE-Bench Verified ソフトウェア工学ベンチマークを表している。

モデルはさらに人間の最後の試験（Humanity's Last Exam）においても急速に精度を向上させている。このベンチマークには、分野の専門家による出題で構成され、それぞれの分野において最も困難な問題を示すものも含まれている。2025 年版スタンフォード AI インデックスによると、首位の OpenAI o1 モデルは質問の 8.8 パーセントしか正解しなかった。以来、精度は 38.3 パーセントに上昇したが、この数字もすでにやや古くなっている。なぜなら、2026 年 4 月時点での最高得点を記録したモデル（Anthropic の Claude Opus 4.6 や Google の Gemini 3.1 Pro など）は 50 パーセントを超える性能を示しているからだ。

ただし、ペロールド氏はベンチマークが常に実世界の結果と一致するとは限らないと注意を促している。「我々は一般的に、システム（またはエージェント）が特定の文脈でどのように機能すべきかを測定する方法を持たない」という。そして、「法理推論のベンチマークが 75 パーセントの精度を示していることが、そのシステムが弁護士事務所の業務においてどの程度適合するかを伝えるのはほとんど役に立たない」と指摘している。

医療分野における AI 研究は進歩を見せている
AI ベンチマークでの進歩は医療分野にも反映されており、ここでの AI の採用率は急加速している。医療研究では特に迅速な導入が見られる。上記のグラフによると、過去二年間だけで医薬品発見における AI 利用に関する論文数は倍増を超えている。また、テキストと共に医療画像を解析するために使用されるマルチモーダルバイオメディカル AI に関する論文数も、二年前的と比べて 2.7 倍に増加している。

LLM は依然として analog クロックを読むのが苦手
AI モデルは一部の分野で急激な改善を遂げた一方で、時計を読むやカレンダーを理解するといった日常的タスクにおいて依然として著しく弱さを持っている。アナログクロックの読み取り能力を測定する ClockBench によると、このタスクに最も優れたモデルである OpenAI の GPT-5.4 でも、正答率は 50 パーセント程度（偶数・奇数のように）だった。

多くのモデルはさらに低いスコアだった。Anthropic の Claude Opus 4.6 は時間を読める確率がわずか 8.9 パーセントであり、これは驚くべきことである（なぜなら、同モデルは他のベンチマークで高いスコアを記録することが多いからだ。（前述したように、Claude Opus 4.6 は Humans Last Exam で最高スコアを記録した。）

もちろん、LLM が現実生活中でこのタスクを求められることは稀だが、ペロールド氏はこれがより一般的な問題であると指摘している。「言語と他のモダリティ（画像や音声など、声のトーンを含む）を組み合わせた質問にシステムが答える際、言語成分が意外にも大きな負担を負う傾向があり、場合によっては非言語情報を完全に無視してしまう」という研究の潮流がある。

AI への投資は 2025 年に新記録を樹立
AI モデルのパフォーマンス向上と AI 企業への投資成長は歩調を踏んでいる。AI アナリティクス企業 Quid のデータによると、2025 年は AI 投資額で過去最高となる US$5810 億以上を記録した。これは 2024 年の 2530 億ドルの倍以上であり、2021 年に樹立された前記録である 3600 億ドルをも超えている。2021 年は M&A に牽引されていたが、2025 年の記録的な結果は AI 企業への民間投資によって実現された。

その資金の大半は米国へ流れ込んでおり、昨年だけで AI への投資額が 3440 億ドルを超えている。

ソフトウェアエンジニアは全員 AI に注力している
しかし、AI の採用に関する話には単なる私的な資金の問題だけでなく、GitHub における AI に対する草の根的な熱意もある。ここでの AI 関連プロジェクト数は 2025 年までに 558 万件に急増し、2020 年以来約 5 倍、2024 年以来 23.7 パーセント増加している。

これは AI 生成プロジェクトの洪水を反映したものでもないようだ。10 回以上のスター獲得を持つプロジェクト数も同様のペースで増加しており、全体として AI プロジェクトに贈られたスター数も類似のペースで増えている。これらは人間の関与があることを示唆している。あるプロジェクトの人気が高いことも驚くべきことではないだろう。オープンソースのエージェント型 AI ソフトウェア OpenClaw はすでに 352,000 のスターを獲得している。批判者は、この熱意が一部 AI ボットやエージェント型プロジェクトに起因すると懸念するかもしれない。ペロールド氏はこれを認め、「おそらく GitHub の使用強度は AI の使用強度と強く相関している」と述べている。しかし、Agents in the Wild というアクティビティ追跡ウェブサイト（スタンフォード報告書には言及されていない）によると、GitHub の活動の大部分はまだ人間によって行われているようだ。

コンピューターサイエンス分野における熱意も強い。過去十年間で AI 関連のコンピューターサイエンス論文数は 102,000 件から 258,000 件へと倍増を超えている。そのうち 68 パーセント以上は学術機関で生産されており、政府と産業がそれぞれ約 11.5 パーセント、12.5 パーセント（2024 年時点）を貢献している。成長は機械学習、コンピュータービジョン、生成 AI の分野から牽引されている。

AI が雇用全体に与える影響はまだ不明瞭
生成 AI の台頭は雇用不安と表裏一体であり、世界最大規模の AI 企業の CEO たちの憂慮すべき予言がこれを加速させたに違いない。しかし現時点でのデータは依然として両義的である。

上記には、AI 置換リスクの高い 2 つのプロフェッション（ソフトウェア開発者とカスタマーサポートエージェント）における年齢層別の「正規化された従業員数」を示すグラフがある。以前と同様に、これらのトレンドはこれらの職業におけるエントリーレベルの職が減り、中級〜シニアポジションは安定または増加していることを示している。しかし、これらの変化はより広範な経済トレンドから分離することが難しい。報告書は、失業率が多くの職業で上昇しており、期待とは逆に、AI に最もさらされていない労働者の失業率の方が、AI に最も露出された労働者よりも高まっていると指摘している。

AI への世論の反応（わずかに）改善傾向
報告書の最も驚くべき発見の一つは、無疑、近年にわたり AI に対する楽観視が小幅ながら明確に増加していることだ：Ipsos による調査の回答者の 59 パーセントが「利点が悪点を上回ると答えた」で、2024 年の 55 パーセントからの上昇である。また、68 パーセントの回答者が AI について「良い理解がある」と答え、2024 年の 67 パーセントからわずかな増加を遂げた。

類似の質問への回答は、全体として AI の受容が否定的より肯定的であることを示唆しているが、同時に一部の否定的感情も増加している。例えば、52 パーセントの回答者は「AI を使用する製品やサービスに『不安を感じる』」と答えた。国による反応には大きな差がある。東南アジア諸国（中国、マレーシア、タイ、インドネシア、シンガポールなど）は AI に対してより肯定的なトレンドを示している。しかし、最も強い年次改善はドイツ（12 パーセント）、フランス（10 パーセント）、オランダ（10 パーセント）で見られた。コロンビアでは最も大きな否定的シフト（-6 パーセント）が見られ、以前からのトレンドの逆転となっている。

AI 規制への信頼度は国によって大きく異なる
増える人々が AI がプラスの影響を与えると感じつつある一方で、その変化は一部の国、特に政府規制の問題において深い不信感を伴っている。顕著なのは、AI 投資で世界をリードする米国ですら、Ipsos 調査回答者のみならず、AI 規制を政府に任せる信頼度はわずか 31 パーセントと低いことだ。多くの欧州諸国や日本でも同様の低信頼度が見られる。一方、アジアおよび南米諸国では、政府が AI を規制する能力への信頼度が高い。

米国とコロンビアの結果は興味深い。米国では AI 規制に対する深い不信感が見られる一方で、多くの回答者は AI の利点が欠点を上ると考える。コロンビアでは逆に、AI 規制への信頼は高いものの、全体としての AI に対する世論が悪化している。これは 2025 年の AI ナラティブの縮図のように感じる。AI モデルの結果の質や、社会に与える影響に対する公衆の認識も、タスクや問いに応じて大幅に変動し、場合によっては大きく異なる。

AI の状況を示すグラフ（2026 年）

Japanese Translation:

同じ日のほかのニュース