
2026/02/07 1:20
Waymoワールドモデル
RSS: https://news.ycombinator.com/rss
要約▶
Japanese Translation:
Waymoは、Waymo World Modelという生成シミュレーションエンジンを公開しました。このエンジンは、極端な天候・自然災害・象やロングホーンのような珍しいオブジェクト、逆走トラックなど安全に関わるインシデントを含むハイパーリアリスティックな自律運転シナリオを生成します。
Google DeepMind の Genie 3 をベースにしたこのモデルは、カメラと LiDAR データを融合し、ドライビングアクション制御・シーンレイアウト制御・時間帯、天候、カスタムシナリオを調整する言語プロンプトという3つの制御機構を提供します。録画済みまたは新規生成されたルートに対して代替ドライビング決定を評価する「what‑if」反実仮想シミュレーションもサポートしています。
Waymo Driver は米国都市で約 2 億マイルの完全自律走行距離を記録し、数十億マイルに相当するバーチャル走行をシミュレートしてきました。World Model はリアルなダッシュカムやモバイルカメラ映像を多模態シミュレーションへ変換し、正確な視覚シーンと一致させることでこの機能を拡張します。効率的なバリアントは実時間の最大4倍速で動作し、計算資源を削減しつつ長時間テストが可能です。
このシステムは、安全性が証明された自律運転を実現するために Waymo の AI エコシステムの重要柱となっており、Waymo と Google DeepMind からなる大規模チームによって開発されています。
本文
Waymo Driver は、ほぼ 2 億マイルに及ぶ完全自律走行距離を達成し、大都市のインフラに不可欠な存在となり、道路安全性の向上にも寄与しています。乗客や地域住民が目にするのは街中での走行だけですが、その裏では Waymo Driver は仮想空間で数十億マイルを移動し、実際に公共道路で遭遇する前から複雑なシナリオを習得しています。
本日、私たちは新しいフロンティア・ジェネレーティブモデル「Waymo World Model」をご紹介できることを嬉しく思います。このモデルは、大規模かつ極めてリアルな自律走行シミュレーションの基準を一新します。
Waymo Driver が逆方向で進む車両を回避するシミュレーション
本シミュレーションは、実際に起きた事象から始まり、カメラと LiDAR 画像を効率的なリアルタイム Waymo World Model によって自動生成しながらスムーズに移行します。
Waymo World Model は Google DeepMind の最先端汎用ワールドモデル「Genie 3」をベースに、運転領域の厳格性に合わせて調整されています。Genie の膨大な世界知識を活かし、竜巻や象との偶発的遭遇といった実際にはほぼ不可能に近い稀少イベントもシミュレートできます。モデルは高い制御性を備えており、エンジニアは簡潔な言語プロンプト・運転入力・シーンレイアウトでシミュレーションを変更できます。また、カメラと LiDAR の両方のデータを含むハイファイディティ、多センサー出力も生成します。
新たに獲得したマルチモーダル世界知識
自律走行業界のほとんどのシミュレーションモデルは、収集したオンロードデータのみでゼロから学習しています。これでは経験が限定されます。Genie 3 は、極めて大規模かつ多様な動画を事前学習することで得た強力な世界知識を持ち、Waymo のフリートで直接観測できない状況も探索可能です。専用のポストトレーニングにより、この 2D 動画から得た知識を Waymo 専用ハードウェア固有の 3D LiDAR 出力へ転移させます。Waymo World Model は、日常的な運転から稀少・長尾シナリオまで、多数のセンサー形式であらゆる場面を生成できます。
極端気象条件と自然災害
- 雪が軽く降ったゴールデンゲートブリッジ上を走行(前方カメラ映像に Waymo の影が見える)
- 竜巻の遭遇
- 沈滞水没した郊外のコーンオフ・ザ・サック、漂う家具付き
- 雪で覆われた熱帯街道を走行
- 激しい火災から脱出
稀少かつ安全性重視のイベント
- 無謀なドライバーが道路外へ突き進む
- 先頭車両が木の枝に衝突
- 上部に家具を不安定に置いた車両の後ろで走行
- 正面から逆方向へ向かい、道路を塞ぐ故障トラック
長尾(意図的な言葉遊び)オブジェクトとその他
- 友好的な象との遭遇
- テキサスロングホーンの遭遇
- ライオンの遭遇
- T‑レックスに扮した歩行者
- 車ほど大きなタムブルウィードの遭遇
Waymo World Model が生成するリアルな 4D ポイントクラウドをインタラクティブに可視化でき、没入感ある閲覧が可能です。
強力なシミュレーション制御
Waymo World Model は以下の三つのメカニズムで高い制御性を実現します。
-
運転アクション制御
指定された運転入力に忠実に従うリアクティブシミュレータ。例えば「もっと自信を持って走行すべきだったのでは?」といった仮想的な逆説イベントを作成可能。 -
シーンレイアウト制御
道路構造、交通信号状態、他道路利用者の挙動をカスタマイズ。選択的配置や変異により独自のシナリオを設計。 -
言語制御
最も柔軟なツールであり、時間帯・天候条件を調整したり、完全に合成されたシーン(長尾イベント等)を生成できます。
世界変異 – 時間帯
- 夜明け
- 朝
- 正午
- 午後
- 夕方
- 夜
世界変異 – 天候
- 曇り
- 霧
- 雨
- 雪
- 晴れ
ダッシュカム映像の変換
Waymo World Model は、モバイルデバイスやダッシュカムから取得した動画(例:雪山に積もる雪堆や夕暮れ時の高速道路)を多モーダルシミュレーションへと変換します。これにより、Waymo Driver がその正確な場面をどのように認識するかをリアリティと事実性を保証しつつ可視化できます。
スケーラブル推論
長い再生時間が必要なシーン(例:狭い車線での交差)では、より効率的な Waymo World Model のバリエーションが計算量を大幅に削減しつつ高リアリズムと忠実度を維持します。これにより、大規模なシミュレーションが可能です。
- 効率化された変種で 4 倍速度再生
- フリーウェイの中止車両や高速交通を迂回
- 混雑した近隣を走行
- 急勾配街道でオートバイを安全に避ける
- SUV の U‑ターン
「不可能」をシミュレートすることで、Waymo Driver は稀少かつ複雑な状況に対して事前に準備され、実際の世界で遭遇する前に長尾課題を安全に乗り越える能力が保証されます。
謝辞
Waymo World Model の実現には、James Gunn、Kanaad Parvate、Lu Liu、Lucas Deecke、Luca Bergamini、Zehao Zhu、Raajay Viswanathan、Jiahao Wang、Sakshum Kulshrestha、Titas Anciukevičius、Luna Yue Huang、Yury Bychenkov、Yijing Bai、Yichen Shen、Stefanos Nikolaidis、Tiancheng Ge、Shih‑Yang Su、Vincent Casser らの研究・エンジニアリング・評価への貢献に感謝します。
また、Chulong Chen、Mingxing Tan、Tom Walters、Harish Chandran、David Wong、Jieying Chen、Smitha Shyam、Vincent Vanhoucke、Drago Anguelov に、このプロジェクトのビジョンとリーダーシップを示していただきありがとうございます。
Jon Pedersen、Michael Dreibelbis、Larry Lansing、Sasho Gabrovski、Alan Kimball、Dave Richardson、Evan Birenbaum、Harrison McKenzie Chapter、Pratyush Chakraborty、Khoa Vo、Todd Hester、Yuliang Zou、Artur Filipowicz、Sophie Wang、Linn Bieske への協力にも感謝します。
さらに Google DeepMind のパートナー(Jack Parker‑Holder、Shlomi Fruchter、Philip Ball、Ruiqi Gao、Songyou Peng、Ben Poole、Fei Xia、Allan Zhou、Sean Kirmani、Christos Kaplanis、Matt McGill、Tim Salimans、Ruben Villegas、Xinchen Yan、Emma Wang、Woohyun Han、Shan Han、Rundi Wu、Shuang Li、Philipp Henzler、Yulia Rubanova、Thomas Kipf)との議論と貴重な洞察にも深く感謝します。