
2026/02/23 21:19
**LiDAR 波形** - 言語数は **40 × 128 × 33** 単語です
RSS: https://news.ycombinator.com/rss
要約▶
Japanese Translation:
要約:
ドミニク・シューベル、ハノー・ホルツヒューター、スティーブン・ペーターズ、マリオ・ビジェリック、およびフェリックス・ハイデは、自律走行用のトランスフォーマーベースの学習DSPを発表し、IEEE/CVF International Conference on Computer Vision (ICCV 2025) の Proceedings(論文番号 28913‑28924)に掲載しました。従来の自動車DSPは各LiDAR波形を個別に処理するため、信号が弱い場合や霧・反射・低SNRで歪むとアーティファクトが発生します。本手法ではトランスフォーマー構造を用いて完全な波形と隣接する信号を解釈し、高忠実度の多エコーポイントクラウドを生成します。
実際の走行シナリオおよび従来型自動車LiDARを使用した天候チャンバーで評価すると、ピーク検出法に比べてチャムファー距離が32 cm改善し、瞬間イメージング手法に比べても20 cmの向上が確認されました。合成データと実データの両方で訓練された結果、著者らは霧の条件下で最大17 m、通常走行時には14 mまで範囲を拡大できる可能性があると報告し、本製品が本格的な自律車両に導入される準備が整っていることを示しています。
本文
Lidar Waveforms は 40 × 128 × 33 単語に相当する価値がある
Dominik Scheuble, Hanno Holzhüter, Steven Peters, Mario Bijelic, Felix Heide
IEEE/CVF 国際コンピュータビジョン会議(ICCV)2025年 論文集 pp. 28913–28924
要旨
Lidar は自動運転に不可欠な技術となり、正確なシーン理解の鍵を握る高解像度 3D スキャンを提供します。その目的のため、LiDAR センサーは反射光から得られる時間分解能付きフルウェーブフォームを測定し、後続のデジタル信号プロセッサ(DSP)が波形内のピークを検出して点群へと変換します。従来の自動車用 LiDAR DSP は各ウェーブフォームを個別に処理するため、隣接するウェーブフォームから得られる貴重な文脈情報を無視しています。その結果、低信号対雑音比(SNR)の領域や高反射率物体、霧などの環境条件下で点群にアーティファクトが生じやすくなります。
隣接ウェーブフォームを活用する手法はトランジエントイメージング分野では広く研究されていますが、実験機器や科学的用途に限定されるケースが多いです。本稿では、Transformer アーキテクチャを採用した学習型 DSP を提案し、隣接ウェーブフォームからの特徴を利用して高精度なマルチエコー点群を直接生成します。実際の走行シナリオと気象室で従来の自動車 LiDAR を使用してデータを収集し、合成データとリアルデータで学習させた結果、従来のピーク検出法や既存トランジエントイメージング手法に比べて Chamfer 距離がそれぞれ 32 cm と 20 cm 改善されました。これにより、霧中で最大 17 m、通常条件下で最大 14 m の測距向上を実現しています。
関連資料
- 補足資料
- BibTeX
@InProceedings{Scheuble_2025_ICCV, author = {Scheuble, Dominik and Holzh\"uter, Hanno and Peters, Steven and Bijelic, Mario and Heide, Felix}, title = {Lidar Waveforms are Worth 40x128x33 Words}, booktitle = {Proceedings of the IEEE/CVF International Conference on Computer Vision (ICCV)}, month = {October}, year = {2025}, pages = {28913-28924} }