
2026/05/20 2:43
Gemini 3.5 フラッシュ
RSS: https://news.ycombinator.com/rss
要約▶
Japanese Translation:
Google は、最先端の知能と自律的なアクションを組み合わせて複雑なワークフローに対応する高速度 AI モデル Gemini 3.5 Flash を発表した。本モデルは今日から Google アプリ、Google Search AI Mode、Android Studio や Gemini API のようなエンタープライズプラットフォームを通じて地球規模で数十億人のユーザーに利用可能であり、処理速度では他の最先端モデルの最大 4 倍を誇り、コーディングおよびエージェントベンチマークにおいてはフラッグシップ級の能力と拮抗する。本モデルは特定タスクにおいて優れ、Terminal-Bench 2.1 で 76.2%、MCP Atlas で 83.6% のスコアを獲得し、CharXiv Reasoning では 84.2% のマルチモーダル理解力を示して業界をリードしている。更新された Antigravity ハネスを使用することで、研究論文の迅速な統合やコードベース全体の変形を 6 時間で実現するとともに、より豊かなインタラクティブな Web インターフェースとグラフィックスの生成が可能になる。Shopify、Macquarie Bank、Salesforce、Ramp、Xero、Databricks のような実世界パートナーはすでに、この技術を利用して商取引予測、顧客オンボーディング、税務フォーム処理、データ診断といった重要なプロセスの自動化を進めている。さらに、Google は今日から信頼されるテストユーザー向けに、本モデルを活用した新しいパーソナル AI エージェント「Gemini Spark」を展開しており、間もなくより広範な利用が可能になるという。Frontier Safety フレームワークを遵守し、強化されたサイバー保護機能や内部の推論ロジックを明らかにする高度な説明可能性ツールを搭載している。また、本モデルの内部バージョン"Pro"が現在使用されており、来月には公開予定で、極致の速度と堅牢な信頼性の両立という新たな業界ベンチマークを確立することになる。
本文
Gemini 3.5 は、複雑で自律的なワークフローの実行をサポートするために設計されています。
【本記事の内容】
- Gemini 3.5 Flash
- 最先端の知能と卓越した速度
- スケーラブルな自律的タスクへの対応
- より豊かなグラフィックス
- 現実世界のインパクト
- ペルソナル AI エージェント
- 「Frontier Safety Framework( frontier 安全保障枠組み)」に基づいて構築
- 本日からの提供開始
本日、私どもは「Gemini 3.5」と呼ぶ最新のモデルファミリーを正式に紹介します。これは、最先端の知能を実行能力と融合させたものであり、より強力かつ高度な自律エージェントの開発において飛躍的な前進を意味します。私たちはこのシリーズを開始するため、「3.5 Flash」を先行してリリースいたします。本モデルは自律代理およびコーディング分野で最先端のパフォーマンスを発揮し、現実世界の実用性を備えた複雑な長期間にわたるタスクの解決にも優れています。
3.5 Flash:世界的規模での提供について 「Gemini 3.5 Flash」は本日、世界中の数十億ユーザーに対し、以下のチャネルを通じて一般利用を開始いたします。
- すべてのユーザー向け: Google アプリケーション「Gemini」、および Google サearch の「AI モード」
- 開発者向け: エージェント第一主義の開発プラットフォーム「Google Antigravity」ならびに「Google AI Studio」と「Android Studio」に含まれる Gemini API
- エンタープライズ向け: 「Gemini Enterprise Agent Platform」と「Gemini Enterprise」
同時に、私どもは「3.5 Pro」の開発も鋭意進めております。本モデルは既に社内にて使用されており、来月のリリースを予定しております。
【3.5 Flash: エージェントおよびコーディング向けに最適化された最先端のパフォーマンス】 Gemini 3.5 Flash は、フラッグシップモデル群にも匹敵する知能を備えつつ、Flash シリーズならではの速度を実現します。これにより、私たちはこれまで以上に強力な自律性及びコーディング能力を持つモデルの開発に成功しました。本モデルは、Terminal-Bench 2.1(76.2%)、GDPval-AA(1656 Elo)、MCP Atlas(83.6%)といった過酷なコーディングや自律性ベンチマークにおいて、そして多モーダル理解分野(CharXiv Reasoning で 84.2%)においても、Gemini 3.1 Pro を上回る結果を達成しています。特に出力トークン速度で見ると、他の最先端モデルの 4 倍もの高速性を発揮します。
Artificial Analysis のインデックスにおいて右上象限に位置付けられる本モデルは、最先端レベルの知能と卓越した速度を兼ね備え、「品質」対「遅延(レイテンシ)」という従来からのジレンマから解放されたことを証明いたします。
【3.5 Flash: スケーラブルな自律的タスクへの対応】 この速度と性能のバランスが取れた特性により、Gemini 3.5 Flash は、長期にわたる自律的なタスクの解決に最適です。以前開発者に数日、監査人には数週間に及ぶ時間を要した作業も、今やわずかな時間で完了させることができ、かつ他の最先端モデルと比べてコストが半額以下という利点を確保できます。本モデルは、新アプリケーションの開発、コードベースのメンテナンス、財務書類の準備など、現実世界の問題を解決するために素早く計画・構築・反復学習を行います。「Antigravity」プラットフォームの最新バージョンと連携することで、Gemini 3.5 Flash は、より高度なユースケースにおいて自律的なサブエージェントをデプロイし、大規模な問題解決を行う強力なエンジンとなります。監下のもと、本モデルは信頼性のあるマルチステップワークフローやコーディングタスクを実行しつつ、最先端のパフォーマンスを維持します。
- Antigravity の活用: Gemini 3.5 Flash は動的基準に基づき、非構造化アセットの自動的な名前付けおよびカテゴリー分類を行います。
- Antigravity の活用: Gemini 3.5 Flash は 2 つのエージェントを駆使し、AlphaZero の論文の内容を合成し、6 時間以内に完全プレイ可能なゲームをコード化します。
- Antigravity ハネス(プラットフォーム)の活用: Gemini 3.5 Flash は、古くから残っている混乱したコードベースを Next.js にトランスフォームするタスクを実行します。
- サブエージェントの活用: Antigravity 上で、新たな都市景観を生成します。
- 2 つのエージェント(ビルダーとプレイヤー)の活用: Antigravity 上で、迅速な自己改善ループを介してゲームを開発します。
Gemini 3 の強力な多モーダル基盤の上に立脚し、Gemini 3.5 Flash はより豊富でインタラクティブな Web ユーザーインターフェース(UI)およびグラフィックスを生成します。
- AI Studio での活用: AI Studio 上で、研究論文に対するインタラクティブアニメーションを作成します。
- AI Studio での活用: テキストの説明のみを提供し、インタラクティブなハードウェアとして生成されます。
- AI Studio での活用: 複数の概念を並行して実行し、学校向けの資金調達イベントの包括的なブランディングコンセプトを構築します。
- AI Studio での活用: 60 秒以内にチェックアウトフローに対する異なる UX アプローチを生成します。
【3.5 Flash: 現実世界におけるインパクト】 Gemini 3.5 Flash の自律的機能は、すでに我々の開発者およびエンタープライズ顧客において、実質的な進展を促すに至っています。「3.5」モデルシリーズを開発するにあたり、私たちは業界パートナーと緊密に協力し、彼らのワークフローにおける重労働( Toil )や複雑さの源泉を理解いたしました。パートナーの皆様からは、数週間の作業を自動化した銀行やフィンテック企業などから、複雑なデータ環境下で洞察を掘り起こすデータサイエンスチームまで、実質的な成果が報告されています。
- Shopify: グローバル規模において、正確な小売商の成長予測を行うために、複数のサブエージェントを並行して実行し、長期にわたる複雑なデータを分析します。
- Macquarie Bank: 100 ページを超える複雑なドキュメントに対して論理推論を行い、関連情報を検索し、低遅延で信頼性の高い提案を行うことで、顧客オンボーディングを加速させることを実証実験(パイロット)にて実施中です。
- Salesforce: 「Agentforce」に Gemini 3.5 Flash を統合し、コンテキストを維持した複数のサブエージェントをデプロイすることで、複雑なエンタープライズタスクの自動化を確実に実現します。
- Ramp: 複雑な請求書に対する多モーダル理解と、過去のパターンに関する推論を組み合わせて、よりスマートで信頼性の高い OCR(文字認識)を実現するのを支援します。
- Xero: サプライヤーの特定や 1099 タスクフォームの情報収集など、数週間にわたる複雑な作業の自律的な管理をエージェントによって実施し、小規模事業者が退屈な事務作業を自動化することを可能にします。
- Databricks: データサイエンティストに対して、リアルタイム情報の監視・取得や、巨大なデータセット横断的な推論による問題診断、解決策の提示など、自律的なワークフローを実行します。
【ペルソナル AI エージェント: 3.5 Flash で構築】 Gemini 3.5 Flash は、現在、グローバル規模で「Gemini アプリ」およびサearch の「AI モード」におけるデフォルトモデルとして採用されています。今日開催される I/O(Google I/O)にて、その自律的能力が日々の生活に最先端レベルの知能をもたらす新機能を実証いたしました。新たなペルソナル AI エージェントである「Gemini Spark」は 3.5 Flash を使用しております。24 時間 365 日稼働し、ユーザーのデジタルライフをナビゲートするほか、あなたの指示の下であなたに代わってアクションを実行します。「Gemini Spark」のロールアウトは、本日から信頼できるテスター向けに行うところから開始され、来週には米国向けの Google AI Ultra サブスクライバーにもベータ版を提供予定とします。
加えて、3.5 Flash の強化された自律コーディング能力により、Search 全体を通じてさらに高度でインテリジェントな体験が実現されています。24 時間 365 日働き続ける新しい情報エージェントの導入から、よりダイナミックな生成 UI 体験の解明まで、詳細は当社のブログ記事をご覧ください。
Gemini 3.5 Flash は、Gyroid パターンを説明するインタラクティブな視覚的表現を構築するために利用されます。
【Gemini 3.5: 最先端安全保障枠組みに基づいて構築】 Gemini 3.5 は、「Frontier Safety Framework( Frontier 安全保障枠組み)」に準拠して開発されました。サイバーセキュリティおよび CBRN(化学・生物・放射性核種)に関する安全保障対策を強化し、有害コンテンツの生成や、安全なクエリへの誤った拒絶反応を引き起こす確率が低減されています。これには、AI の内なる推論プロセスに応答前に確認・理解を助ける、より高度な安全性トレーニングと緩和策(ミtigations)、ならびに解釈可能性ツールが含まれます。
【3.5 Flash: 今日から利用可能】 Gemini 3.5 Flash は、本日、「Google Antigravity」「Google AI Studio」と「Android Studio」に含まれる Gemini API、「Gemini Enterprise Agent Platform」、および「Gemini Enterprise」を通じて一般ユーザーに公開されています。また、現在では「Gemini アプリ」およびサearch の「AI モード」でも、すべてのユーザーにご利用いただけます。Gemini チーム全体の皆様が心待ちにする通り、皆さまからどのような創造的な成果を生まれさせるか、大変楽しみにしております。
Google からの他のニュースをお送りします。 完了しました。もう一歩。購読確認のため、お手持ちのメールボックスをチェックしてください。 既に当社のニュースレターをご購読いただいております。