
2026/05/20 2:46
ジェミニ・オムニ
RSS: https://news.ycombinator.com/rss
要約▶
Japanese Translation:
元の要約は高品質です。粒度細かいリスト項目を流暢でプロフェッショナルな段落に統合し、正確性を維持することに成功しています。正当性の点では変更は厳密には必要ありませんが、クリエイティブ機能とセキュリティ機能の間での移行をよりスムーズにするという議論も可能でしょう。ただし、現在の流れは論理的です。
要約:
Google の最新イノベーションである Gemini Omni は、高度な推論能力と強力な編集機能を Google Flow というクリエイター向け専用のスタジオ内に統合することで、デジタル制作を根本的に変革します。先ほどのツールとは異なり、このシステムはユーザーが簡素なプロンプトだけでカメラアングルやシーンの環境を操作し、手動介入なしに複雑な視覚効果——例えば無見のオブジェクトや同期された照明など——を生成する能力を備えています。重要なのは、生成されたすべてのコンテンツには SynthID と C2PA Content Credentials という不可知なデジタルウォーターマークが搭載されており、Chrome および Search を通じて厳格な真正性の検証が可能になっていることです。この透明性は、AI 生成メディアに関する業界の懸念に対処し、リリース前にコンテンツの出所(プロベニエンス)を確認します。セキュリティは、パブリックリッチの前に専門家が脆弱性を独立してテストする厳格な外部レッドチーム化によって保証されています。評価方法は自動化チェックと人間による監督を組み合わせて進化するにつれ、業界は高忠実度生成アートと破られにくいセキュリティ追跡を兼ね備えた新しい標準へと移行しており、クリエイターに前例のない制御を提供しつつ、消費者を誤情報から保護します。
本文
Gemini Omni は、Gemini の推論能力と創造能力が相融化するプラットフォームです。世界認識、マルチモーダル機能、および編集能力において飛躍的な向上をもたらします。
プロンプト例:
- 手の指先の穴から見た地面が、超ズームにより鋭い画質で拡大されるような映像にしてください。
- に映る指が動物のぬいぐるみに触れた瞬間、その動物が発する音声が再生されますように。
- アパートの明かりが音楽のリズムに同步して点灯しますように。 -バイオリニストを画像提示された環境内に移動させますように。
- バイオリンを不可視化しますように。
- カメラアングルを、バイオリニストの後方からの肩越しビューに変更しますように。 -宇宙船を<対象>に置き換えますように。 -チェーンreaction のような軌道上を高速で転がる大理石の映像を、連続的な滑らかなショットで生成してください。
- タンパク質の折りたたみ過程を粘土細工(claymation)で解説する動画を作成。すべては粘土製であり、手は登場せず、ストップモーション手法を採用し、正確な表現を心がけてください。
- 脳内の海馬がどのように機能するかをスケオモルフィズム風のストップモーション映像で解説する動画を生成。魅力的なナレーションを用い、セイウチの描写は行わないこと。音声のカットは終了時に行わないこと。テキスト表示は付与しないこと。
- アルファベットの文字それぞれに対応した珍しいアイテムがテーブルに置かれた状態で表示される動画を作成。「C」にはカピバラ、「D」にはディスコグローブ、「L」にはラヴァランプなど。全 26 文字について、それぞれ異なるアイテムを提示し、下部左隅に黒いマーカーで書かれたような紙切れ状のローサーサー(lower thirds)に該当する文字を表示。一度に一つのみを画面に表示し、約 9 フレームずつ(24FPS で動作)、最後は「THE END」と記した紙切れを表示します。全体的には落ち着いた滑らかな音楽を伴います。
- 「did, you, know, that, this, model, can, do, pretty, good, text!?」という言葉を一つずつ画面に表示し、各単語ごとに異なるアニメーションスタイルで表現。リズムに合わせた完璧なペース配分であり、サッズリール(showreel)のようなダイナミックさを持たせます。
プロンプト作成について
- リアルで論理的かつ創造的な出力を得るためには、当社の「プロンプトガイド」をご利用ください。
モデルのトレーニング・開発における評価
- モデルのトレーニング中に実施され、終了後にも継続的に自動化された評価と人間による評価が行われ、その進捗と性能を監視するものです。
人間によるレッドチーム(Human red teaming)
- モデル開発チームとは独立した専門チームによって実施され、安全ポリシーや目指すべき成果(desiderata)に従って、意図的に弱点を発見し、モデルが安全性の方針および期待される結果を遵守するかを検証します。
自動化されたレッドチーム(Automated red teaming)
- システム全体にわたって Gemini Omni Flash の安全性・セキュリティ面を動的に評価し、人間によるレッドチームや静的評価を補完します。
倫理と安全性に関する審査(Ethics and safety reviews)
- モデルのリリース前の段階で行われる審査です。
Gemini アプリ、Google Flow、YouTube で作成または編集されたコンテンツには、我々が開発した目立たないデジタルウォーターマーク「SynthID」と C2PA コンテンツ認証情報が組み込まれています。
- Gemini アプリ(近日では Chrome ブラウザと検索エンジンでも対応予定)を利用して、簡単にコンテンツの検証が可能になります。
- 私たちがどのようにしてコンテンツの透明性と検証ツールを強化し、インターネット上のあらゆるコンテンツがどのように作成・編集されたかを理解いただけるよう展開しているかについては、当社のブログ記事をぜひご覧ください。
Gemini
- 創造性と生産性を飛躍的に高めます
Google Flow
- クリエイターと共同で開発され、クリエイターのために設計された AI による創作スタジオ
YouTube Shorts
- YouTube で発見・視聴・創作を行うための短尺コンテンツプラットフォーム