AI の状況を示すグラフ(2026 年)

2026/04/19 2:12

AI の状況を示すグラフ(2026 年)

RSS: https://news.ycombinator.com/rss

要約

Japanese Translation:

2026年のスタンフォード AI アレックスレポートは、モデル開発において民間企業が決定的な優位性を確立したことを明らかにしており、主要リリースの90%以上を民間企業が担うようになり、過去には学術界が主導していた状況から大きく変化している。米国における前例のない5810億ドルの投資と、2021年以降に世界計算能力が30倍に増加したことを原動力としており、市場はNvidiaのようなハードウェア大手や中国の産業ロボットリーダー企業に大きく依存している。「Humanity's Last Exam」などのベンチマークでの breakthrough に加え、AI システムはアナログ時計を読むなどの基本的な視覚タスクでも依然として苦労しており(一部のモデルでは約8.9% の精度に留まるなど)、技術的な制約が残っている。この技術的急成長は労働市場を再形成し、初級ソフトウェア職での減少を招きつつ、中途キャリア職は安定化しており、失業率の上昇の中で作業員がスキルアップを迫られている。世論は地域によって異なる;欧州や南米では AI の利点に對してより楽観的になりつつある一方、政府規制への信頼については米国および一部の欧州で最も低い水準である。今後、業界の優位性と計算能力の拡大は、現在の推移に基づくと2026年4月まで続きそうだ。

本文

主導的な AI モデルの能力は引き続き加速的に向上しており、OpenAI や Anthropic を含む最大の AI 企業들도本年後半にかけて IPO を目視している。しかしながら、AI に対する懐疑や反感は引き続きくすぶり続け、一部の状況では沸点を超えつつある。特に米国においては、地方自治体が新たなデータセンターの開発に対する規制、あるいは outright な禁止に着手し始めている。これらの動向を追跡するのは困難ではあるが、スタンフォード大学のヒューマン・セントラルド人工知能センター(HAI)が刊行する 2026 年版「AI インデックス」はそれを果たしている。この報告書は 400 ページを超す規模であり、ベンチマークスコアから投資動向、世論調査に至るまで多角的な視点から AI を捉える数十のデータポイントとグラフを収めている。以前と同様に(2021 年〜2025 年までの当社の Coverage も参照されたい)、我々は報告書を精査し、2026 年の AI の現状を要約する主要なトレンドを抽出した。

米国企業が AI モデル開発でリード
過日の decade にわたり AI モデルのリリースにおいて米国が主導的役割を果たしてきたことは、2025 年を含め以前と同様に真実である。エポック AI(Epoch AI)の研究によると、2025 年には米国の組織によって 50 の「注目すべき」モデルがリリースされた。一方で、中国勢はこの差を縮めてきている。

注目すべきモデルのほとんどは産業分野内で開発されたものであり(学術機関や政府機関とは対照的に)、エポック AI は 2025 年に産業系から 87 の注目モデルリリースを追跡したのに対し、他の源泉からはわずか 7 つしか確認されていない。これは長期的な主要なトレンドである。産業系でリリースされたモデルは現在、注目すべきモデルの 90 パーセント以上を占めており、2015 年には約半分、2003 年にはゼロだったと対照的である。

中国がロボティクス分野でリード
米国の企業が最も多数の注目 AI モデルをリリースした一方で、ロボットの導入においては中国が同様に明確な優位性を示している。国際ロボット連盟(IFR)のデータによると、中国は 2024 年に 295,000 台の産業用ロボットを導入し、日本が約 44,500 台、米国が 34,200 台を導入した。

世界の AI 計算能力は 2022 年以来毎年 3.3 倍に成長
最新のスタンフォード AI インデックス報告書には、AI インフラ拡大に関する目を引く数字が多く含まれているが、エポック AI の持つ総 AI 計算容量の計測値がそれらを凌駕する。Nvidia の H100e の計算能力を基準として示されたこのグラフでは、世界の AI 計算能力は 2022 年以降、毎年倍以上に増加していることがわかる。総 AI 計算容量は、追跡が始まった 2021 年以来 30 倍に伸びている。Nvidia は今回の拡大で最大便益を得ており、その GPU が現在世界の総 AI 計算容量の 60 パーセント以上を占めている。また、Amazon や Google(自社 AI 向けハードウェアを開発している企業)がそれぞれ第 2・第 3 の順位を収めている。

AI モデルのトレーニングによる温室効果ガス排出量は巨大
スタンフォードの AI インデックスは以前から AI トレーニングによる二酸化炭素排出量を指摘しており、この問題は引き続き憂慮すべき方向に進展している。報告書によると、xAI の Grok 4 といった最新の最先端大規模言語モデル(LLM)をトレーニングするだけでも 72,000 トン以上の炭素換算排出量が生じると推定されている。これは以前の見積もりから大幅な増加である。OpenAI の GPT-4 は 5,184 トン、Meta の Llama 3.1 405B は 8,930 トンと推計されていた。AI インデックス実行委員会の共同ディレクターを務めるレイ・ペロールド氏は「これらの数字は推計値であり、慎重に解釈すべきだ」と警告している。「特に Grok の場合、公共メディア(フォーブス記事など)、xAI の声明、その他の検証不可能なソースから推測された入力を大きく依存しており、一定の不確実性が残っている」と述べた。一方で、ペロールド氏は「エポック AI は独自に Grok 4 の排出量を大幅に高く、約 140,000 トンの CO₂と推定している」とも指摘している。

AI インference(推論)からの排出量も引き続き増加しており、結果はモデルによって異なる。報告書では、最も非効率的なインフェレンスを持つモデルの排出量は、最も効率的なものの 10 倍以上と推定されている。DeepSeek の V3 モデルは「中程度の長さ」のプロンプトに応じる際に約 23 ワットの電力を消費すると推計され、Claude 4 Opus は約 5 ワットだった。

LLM は急速に新たなベンチマークを破っている
AI モデルの能力は過去十年間で驚異的な速度で向上し、上記グラフのように進展がさらに加速している。特にマルチモーダル LLM は、新たなベンチマークが生み出される pace にほぼ同速でそれを制覇しつつある。エージェント型 AI(Agentic AI)では最も顕著な進歩が見られる。チャートの右端の 2 つの急勾配の直線は、自律的なコンピューター利用を評価する OSWorld ベンチマークと、自律的なコーディングを評価する SWE-Bench Verified ソフトウェア工学ベンチマークを表している。

モデルはさらに人間の最後の試験(Humanity's Last Exam)においても急速に精度を向上させている。このベンチマークには、分野の専門家による出題で構成され、それぞれの分野において最も困難な問題を示すものも含まれている。2025 年版スタンフォード AI インデックスによると、首位の OpenAI o1 モデルは質問の 8.8 パーセントしか正解しなかった。以来、精度は 38.3 パーセントに上昇したが、この数字もすでにやや古くなっている。なぜなら、2026 年 4 月時点での最高得点を記録したモデル(Anthropic の Claude Opus 4.6 や Google の Gemini 3.1 Pro など)は 50 パーセントを超える性能を示しているからだ。

ただし、ペロールド氏はベンチマークが常に実世界の結果と一致するとは限らないと注意を促している。「我々は一般的に、システム(またはエージェント)が特定の文脈でどのように機能すべきかを測定する方法を持たない」という。そして、「法理推論のベンチマークが 75 パーセントの精度を示していることが、そのシステムが弁護士事務所の業務においてどの程度適合するかを伝えるのはほとんど役に立たない」と指摘している。

医療分野における AI 研究は進歩を見せている
AI ベンチマークでの進歩は医療分野にも反映されており、ここでの AI の採用率は急加速している。医療研究では特に迅速な導入が見られる。上記のグラフによると、過去二年間だけで医薬品発見における AI 利用に関する論文数は倍増を超えている。また、テキストと共に医療画像を解析するために使用されるマルチモーダルバイオメディカル AI に関する論文数も、二年前的と比べて 2.7 倍に増加している。

LLM は依然として analog クロックを読むのが苦手
AI モデルは一部の分野で急激な改善を遂げた一方で、時計を読むやカレンダーを理解するといった日常的タスクにおいて依然として著しく弱さを持っている。アナログクロックの読み取り能力を測定する ClockBench によると、このタスクに最も優れたモデルである OpenAI の GPT-5.4 でも、正答率は 50 パーセント程度(偶数・奇数のように)だった。

多くのモデルはさらに低いスコアだった。Anthropic の Claude Opus 4.6 は時間を読める確率がわずか 8.9 パーセントであり、これは驚くべきことである(なぜなら、同モデルは他のベンチマークで高いスコアを記録することが多いからだ。(前述したように、Claude Opus 4.6 は Humans Last Exam で最高スコアを記録した。)

もちろん、LLM が現実生活中でこのタスクを求められることは稀だが、ペロールド氏はこれがより一般的な問題であると指摘している。「言語と他のモダリティ(画像や音声など、声のトーンを含む)を組み合わせた質問にシステムが答える際、言語成分が意外にも大きな負担を負う傾向があり、場合によっては非言語情報を完全に無視してしまう」という研究の潮流がある。

AI への投資は 2025 年に新記録を樹立
AI モデルのパフォーマンス向上と AI 企業への投資成長は歩調を踏んでいる。AI アナリティクス企業 Quid のデータによると、2025 年は AI 投資額で過去最高となる US$5810 億以上を記録した。これは 2024 年の 2530 億ドルの倍以上であり、2021 年に樹立された前記録である 3600 億ドルをも超えている。2021 年は M&A に牽引されていたが、2025 年の記録的な結果は AI 企業への民間投資によって実現された。

その資金の大半は米国へ流れ込んでおり、昨年だけで AI への投資額が 3440 億ドルを超えている。

ソフトウェアエンジニアは全員 AI に注力している
しかし、AI の採用に関する話には単なる私的な資金の問題だけでなく、GitHub における AI に対する草の根的な熱意もある。ここでの AI 関連プロジェクト数は 2025 年までに 558 万件に急増し、2020 年以来約 5 倍、2024 年以来 23.7 パーセント増加している。

これは AI 生成プロジェクトの洪水を反映したものでもないようだ。10 回以上のスター獲得を持つプロジェクト数も同様のペースで増加しており、全体として AI プロジェクトに贈られたスター数も類似のペースで増えている。これらは人間の関与があることを示唆している。あるプロジェクトの人気が高いことも驚くべきことではないだろう。オープンソースのエージェント型 AI ソフトウェア OpenClaw はすでに 352,000 のスターを獲得している。批判者は、この熱意が一部 AI ボットやエージェント型プロジェクトに起因すると懸念するかもしれない。ペロールド氏はこれを認め、「おそらく GitHub の使用強度は AI の使用強度と強く相関している」と述べている。しかし、Agents in the Wild というアクティビティ追跡ウェブサイト(スタンフォード報告書には言及されていない)によると、GitHub の活動の大部分はまだ人間によって行われているようだ。

コンピューターサイエンス分野における熱意も強い。過去十年間で AI 関連のコンピューターサイエンス論文数は 102,000 件から 258,000 件へと倍増を超えている。そのうち 68 パーセント以上は学術機関で生産されており、政府と産業がそれぞれ約 11.5 パーセント、12.5 パーセント(2024 年時点)を貢献している。成長は機械学習、コンピュータービジョン、生成 AI の分野から牽引されている。

AI が雇用全体に与える影響はまだ不明瞭
生成 AI の台頭は雇用不安と表裏一体であり、世界最大規模の AI 企業の CEO たちの憂慮すべき予言がこれを加速させたに違いない。しかし現時点でのデータは依然として両義的である。

上記には、AI 置換リスクの高い 2 つのプロフェッション(ソフトウェア開発者とカスタマーサポートエージェント)における年齢層別の「正規化された従業員数」を示すグラフがある。以前と同様に、これらのトレンドはこれらの職業におけるエントリーレベルの職が減り、中級〜シニアポジションは安定または増加していることを示している。しかし、これらの変化はより広範な経済トレンドから分離することが難しい。報告書は、失業率が多くの職業で上昇しており、期待とは逆に、AI に最もさらされていない労働者の失業率の方が、AI に最も露出された労働者よりも高まっていると指摘している。

AI への世論の反応(わずかに)改善傾向
報告書の最も驚くべき発見の一つは、無疑、近年にわたり AI に対する楽観視が小幅ながら明確に増加していることだ:Ipsos による調査の回答者の 59 パーセントが「利点が悪点を上回ると答えた」で、2024 年の 55 パーセントからの上昇である。また、68 パーセントの回答者が AI について「良い理解がある」と答え、2024 年の 67 パーセントからわずかな増加を遂げた。

類似の質問への回答は、全体として AI の受容が否定的より肯定的であることを示唆しているが、同時に一部の否定的感情も増加している。例えば、52 パーセントの回答者は「AI を使用する製品やサービスに『不安を感じる』」と答えた。国による反応には大きな差がある。東南アジア諸国(中国、マレーシア、タイ、インドネシア、シンガポールなど)は AI に対してより肯定的なトレンドを示している。しかし、最も強い年次改善はドイツ(12 パーセント)、フランス(10 パーセント)、オランダ(10 パーセント)で見られた。コロンビアでは最も大きな否定的シフト(-6 パーセント)が見られ、以前からのトレンドの逆転となっている。

AI 規制への信頼度は国によって大きく異なる
増える人々が AI がプラスの影響を与えると感じつつある一方で、その変化は一部の国、特に政府規制の問題において深い不信感を伴っている。顕著なのは、AI 投資で世界をリードする米国ですら、Ipsos 調査回答者のみならず、AI 規制を政府に任せる信頼度はわずか 31 パーセントと低いことだ。多くの欧州諸国や日本でも同様の低信頼度が見られる。一方、アジアおよび南米諸国では、政府が AI を規制する能力への信頼度が高い。

米国とコロンビアの結果は興味深い。米国では AI 規制に対する深い不信感が見られる一方で、多くの回答者は AI の利点が欠点を上ると考える。コロンビアでは逆に、AI 規制への信頼は高いものの、全体としての AI に対する世論が悪化している。これは 2025 年の AI ナラティブの縮図のように感じる。AI モデルの結果の質や、社会に与える影響に対する公衆の認識も、タスクや問いに応じて大幅に変動し、場合によっては大きく異なる。

同じ日のほかのニュース

一覧に戻る →

2026/04/19 5:54

『好みの色を選べる:NIST の科学家らが、任意の波長のレーザーを開発』

## Japanese Translation: NIST の科学者と協力者が、Scott Papp という NIST の物理学者をリーダーとして発表された「Monolithic 3D integration of tantalum pentoxide nonlinear photonics」という論文に詳述されているように、特殊な材料の複雑なパターンをシリコンウエハーに堆積させることで、統合光子デバイスのチップ作成における画期的手法を開発しました。この革新は、サイズ、コスト、電力に関する重要な歴史的制約を解決し、量子コンピューティングなどの高度な技術用のコンパクトで高品質なレーザーの実現を可能にします。酸化シリコン、リチウムニオブате、タンタル五酸化物(単一のレーザー色を多様な波長に変換しつつ過度の発熱を抑える材料)を含むマルチレイヤーアプローチを用いることで、チームはビールコスター程度のサイズのパターンに、約 10,000 の光子回路を備えた指先ほどの大きさのチップを約 50 個集積することに成功しました。以前是高品質なレーザーは特定の波長(例:980 nm の赤外線)のみに存在し、量子技術の利用が専門的な研究室に限定されていましたが、この画期的進展により、携帯型光原子時計や地震予測システムといった現場での応用が可能になります。光原子時計や量子コンピュータなどの量子技術には、ルビジウム(780 nm の赤)やストロンチウム(461 nm の青)など、異なる原子に合わせた特定の色のレーザーが多く必要とされますが、この新技術はそれを効果的に解決します。この技術は、効率的な光処理を必要とする産業において量子デバイスへのアクセスを民主化するだけでなく、研究機関と Octave Photonics などのスタートアップ間の協力を促進します。*Nature* に掲載されたこれらの発見は、光子機能と電気システムを統合する道を開き、人工知能から暗物質調査に至るまでの分野を変革する可能性があります。これにより、複雑な科学ツールが従来の実験室の外でも手頃な価格で利用できるようになります。

2026/04/19 1:26

ボーイング社の B-52 ストラトフォートレス爆撃機に搭載された、スタートラッカー内の電気式傾斜計。

## Japanese 翻訳: アストロコンパスは、1960 年代の B-52 爆撃機向けに開発され、乗組員が手動で行っていた複雑な三角法の計算を自動化し、天体航法を画期的に変化させました。ジャミングに脆弱な現代デジタルシステムと異なり、この電気機械装置は、外部デジタル信号を使用せずに、シンクロン(変送機)および光増倍管を用いて恒星を追跡する信頼性の高い抗ジャミング方式を提供しました。恒星位置の物理的な追跡と天球のアナログモデルを組み合わせることで、システムはパイロットにリアルタイムでの航法更新を通じて正確な位置を決定することを可能にしました。 公式空軍年誌からのデータに基づいて動作し、この装置は時間や恒星の赤緯などの入力をノブで調整するマスターコントロールパネルを搭載していました。これらの設定は、安定したジャイロプラットフォームとガラスドーム型望遠鏡を含む組立体内の 19 のコンポーネントを駆動しました。アストロコンパスは「位置線」技術を使用し、測定された恒星の高度を計算された期待値と比較することで航空機の軌跡を特定しました。この自動化により、困難な手動手順はスムーズな電気機械プロセスへと変換され、爆撃機艦隊が重要な航法任務において、作戦能力とミッション安全性を大幅に向上させました。

2026/04/19 4:19

Claude のデザインに関する考察と感情

## 日本語翻訳: 要約:中心的な論点是、Figma の専用でロックされたファイル形式がネイティブのスキーマを持たず、深いエイリアシングおよび未文書化されたプリミティブに依存を迫られること(例:946 色の変数を含むネストされたグループのあるファイル)であり、これがコードトレーニング済みの AI モデルが設計論理を正確に解釈することを妨げる。LLM はこれらの特定の不透明な Figma 構造ではなくコードに対してトレーニングされているため、「Figma Make」のような現在のツールは、設計ファイルが依然として規範的であると示唆することでユーザーを誤導し、実質的にワークフローを新しいエージェント時代と不相容の専用エコシステムにロックしている。その対応として、Claude Design とような新たなツールは、「HTML と JS をすべて徹底する」というアプローチを取り、コードと直接統合してレポジトリから AI エージェントへ供給される統一されたフィードバックループを創出する。著者は業界における分岐の予測を行う:一方は誠実なコード連結による生産ツールへの道筋、他方は Photoshop に似た制約のない探求環境への道筋となる。クリーンなコードからのこの転換を批判しつつも、著者は Sketch などの競合業者に対してネイティブ機能に安住するのではなく、粒子エフェクトやメッシュ変換などの特定機能を備えた革新を促し、Figma の形式が AI エージェントに必要なトレーニングデータへの含まれにくさを指摘している。 ## テキストを翻訳 (必要に応じて;そうでない場合は元のものを繰り返す): ## Summary: The core argument is that Figma's proprietary, locked-down file format lacks a native schema, forcing reliance on deep aliasing and undocumented primitives (exemplified by files containing 946 color variables within nested groups) that prevent code-trained AI models from accurately interpreting design logic. Because LLMs were trained on code rather than these specific, opaque Figma structures, current tools like "Figma Make" are misleading users by suggesting the design file remains canonical, effectively locking workflows into a proprietary ecosystem incompatible with the emerging agentic era. In response, new tools like Claude Design adopt an "HTML and JS all the way down" approach, integrating directly with code to create a unified feedback loop where repositories feed AI agents. The author predicts a fork in the industry: one path toward honest, code-linked production tools, and another for unconstrained exploration environments similar to Photoshop. While criticizing this shift away from clean code, the author also urges competitors like Sketch to innovate with specific features (particle effects, mesh transforms) rather than resting on native capabilities, noting that Figma's format prevents its inclusion in necessary training data for AI agents.