
2026/04/03 1:10
Google が Gemma 4 のオープンモデルをリリースしました。
RSS: https://news.ycombinator.com/rss
要約▶
Japanese Translation:
概要:
Gemma 4は、Google の Gemini 3 研究に基づく軽量かつオープンソースの AI モデルであり、モバイル電話、IoT デバイス、およびパーソナルコンピュータ向けにパラメータあたり高い知能を提供するよう設計されています。テキスト・画像・音声といった多モーダルな推論をサポートし、140 言語で動作します。アーキテクチャはエージェント型ワークフローを取り入れており、モデルがタスクの計画、アプリの操作、関数呼び出し、およびユーザー好みのフレームワークによる振る舞いの微調整を行えるようにしています。Gemma 4 はユーザー自身のハードウェア上で実行できるため、効率的な開発と展開が可能です。ベンチマーク結果は優れた性能を示しており、IT Thinking(31B)、MMMLU(1365 タスク中約 85%)、MMMU Pro(76.9–44.2%)、AIME 2026 数学ノーツール(89.2–20.8%)、LiveCodeBench v6 コーディング(80.0–29.1%)、GPQA Diamond 科学知識(84.3–42.4%)および τ2‑bench エージェント型ツール使用小売(86.4–6.6%)において高いスコアを記録しています。これらのスコアは、Gemma 3 など以前のモデルを上回りつつ、デバイス内での展開に十分な効率性を保っていることを示し、消費者向けデバイスおよび企業用途に対して競争力があり低リソースで利用できる AI プラットフォームとして位置づけられます。
本文
Gemma 4
— Gemini 3 の研究と技術をベースに、パラメータ当たりの知能性を最大化した、最もインテリジェントなオープンモデルです。
スライド 1 / 2
- 計算・メモリ効率の最高峰
- モバイルや IoT デバイス向けの新たな知能レベル
- パラメータ当たりの知能性は前例なし
- 個人用コンピュータにおける最先端知能
機能 | 性能 | 安全性 | ダウンロード
スライド 1 / 5
- エージェントワークフロー – 計画・アプリナビゲーション・代行タスクを自律的に実行するエージェントを構築し、関数呼び出しをネイティブサポートします。
- マルチモーダル推論 – 音声と映像の理解力が高く、豊かなマルチモーダル体験を実現するアプリケーション開発が可能です。
- 140 言語対応 – 翻訳だけでなく文化的文脈も把握した多言語エクスペリエンスを構築できます。
- ファインチューニング – お好みのフレームワーク・手法で Gemma を学習させ、特定タスクに最適化します。
- 効率的アーキテクチャ – 自前ハードウェア上でモデルを実行し、開発とデプロイをスムーズに行えます。
ベンチマーク
| モデル | 31B IT | 26B A4B IT | E4B IT | E2B IT | 27B IT |
|---|---|---|---|---|---|
| Gemma 4 |
注:ベンチマークデータはプレースホルダーです。実際の数値に置き換えてください。
多言語 Q&A
- MMMLU 多言語 QA – 85.2% / 82.6% / 69.4% / 60.0% / 67.6%
- MMMU Pro マルチモーダル推論 – 76.9% / 73.8% / 52.6% / 44.2% / 49.7%
AIME 2026 数学(ツール未使用)
- 89.2% / 88.3% / 42.5% / 37.5% / 20.8%
LiveCodeBench v6(競技コーディング問題)
- 80.0% / 77.1% / 52.0% / 44.0% / 29.1%
GPQA Diamond 科学知識(ツール未使用)
- 84.3% / 82.3% / 58.6% / 43.4% / 42.4%
τ2‑bench エージェントツール利用 – 小売業
- 86.4% / 85.5% / 57.5% / 29.4% / 6.6%
Gemma の世界へようこそ
他の開発者が Gemma をどのように活用しているかを探求してください