Terrain Diffusion: A Diffusion-Based Successor to Perlin Noise

2025/12/11 3:37

Terrain Diffusion: A Diffusion-Based Successor to Perlin Noise

RSS: https://news.ycombinator.com/rss

要約

Japanese Translation:

概要:
Terrain Diffusion は、Procedural ワールド生成のために Perlin ノイズを置き換える AI 時代の後継として提案されており、拡散モデルとシームレスで無限延長性、種子一貫性、定時間ランダムアクセスなどの古典的ノイズ特性を融合しています。
その中核となる革新は InfiniteDiffusion アルゴリズムであり、惑星コンテキスト用の拡散モデルと細部用の複数の拡散モデルを階層的に重ね合わせ、地球規模の範囲全体で出力を安定化させるコンパクトなラプラス符号化方式でエンコードします。
オープンソースの無限テンソルフレームワークは、開発者が定数メモリ内で境界のないテンソルを操作できるようにし、少ステップ一致蒸留により生成速度を加速します。これらの要素が組み合わさることで、ほんの数ステップの推論だけで大規模かつ一貫した地形をリアルタイムに合成できるようになります。
著者は、このアプローチがゲームワールド、シミュレーション、および仮想訓練環境向けの拡散ベースの Procedural 生成を実用化し、スタジオやインディ開発者が豊かでリアルなランドスケープを制作するための技術的ハードルを下げると期待しています。
論文は Alexander Goslin によって 2025年12月9日火曜日 07:10:35 UTC に提出(ファイルサイズ 12,075 KB)。

本文

概要

数十年にわたり、手続き的世界はパーリンノイズのような手続き的ノイズ関数を基盤として構築されてきました。これらは高速で無限に生成できるという利点があるものの、現実感と大規模な一貫性には根本的な制約があります。本研究では、**Terrain Diffusion(テレイン・ディフュージョン)**を提案します。これは、拡散モデルの高精度と手続き的ノイズが不可欠だった特徴――シームレスで無限に広がる領域、種(seed)の一貫性、および定時間ランダムアクセス――を統合したAI時代の後継技術です。

中心となる概念は InfiniteDiffusion(インフィニット・ディフュージョン) という無限生成用アルゴリズムで、境界のない風景をリアルタイムにシームレスに合成することが可能です。階層的な拡散モデルスタックは惑星規模のコンテキストと局所詳細を結び付け、圧縮されたラプラス符号化(Laplacian encoding)が地球規模の動的範囲にわたる出力を安定化させます。さらに、オープンソースの無限テンソルフレームワークは境界のないテンソルを定数メモリで操作できるようにし、少ステップ一貫性蒸留(few‑step consistency distillation)により効率的な生成が実現します。

これらすべての要素が組み合わさることで、拡散モデルは手続き的世界生成の実用的基盤となり、全惑星を一貫性・制御可能かつ無限に合成できるようになります。

同じ日のほかのニュース

一覧に戻る →

2025/12/11 5:47

Apple Services Experiencing Outage

## Japanese Translation: > Apple の米国ウェブサイトのフッターには、顧客向けに必要なリンクが提供されています。 > - 「System Status」ページ > - 近くの Apple Store や他の小売店を探すための案内 > - 電話サポート(1‑800‑MY‑APPLE) > さらに、© Apple Inc. All rights reserved、Privacy Policy、Terms of Use、Sales and Refunds、Legal、および Site Map といった法的・情報リンクも含まれています。フッターの内容は米国ユーザー向けに特化されています。

2025/12/11 3:58

Super Mario 64 for the PS1

## Japanese Translation: > このリポジトリにはゲームの完全なソースコードベースが含まれていますが、意図的に必要なアセットファイル(特に **assets.sm64**)はすべて除外されています。したがって、ユーザーはプロジェクトを構築するためにタイトルのオリジナルコピーからこれらのアセットを抽出する必要があります。 > > ディレクトリ構成は典型的なゲーム開発の慣習に従っており、多くのトップレベルフォルダーが含まれています:**actors**, **assets**(サブフォルダー *anims* と *demos* 付き), **bin**, **build**, **data**, **doxygen**, **enhancements**, **include**, **levels**, **lib**, **sound**, **src**(サブフォルダー *audio*, *buffers*, *engine*, *game*, *goddard*, *goddard_og*, *menu*, *port*), **text**, **textures**, および **tools**。 > > **src/goddard** 内のコードには、リライトされたマリオイントロ画面が含まれています。一方で **src/goddard_og** は元のバックアップを保持しています。**src/menu** ディレクトリはタイトルスクリーン、ファイル選択、アクション選択、およびデバッグレベル選択メニューを実装しています。**Src/port** にはポート固有のコードとともにオーディオおよびビデオレンダラーコンポーネントが格納されています。 > > コントリビューションはプルリクエストで歓迎されます。ただし、主要な変更はまずイシューを開いて議論する必要があります。これにより構造化されたレビュー プロセスが確保されます。この設定により、開発者はコードベースを改善できる一方で、最終ユーザーはコンパイルのために依然として専有アセットへのアクセスが必要です。

2025/12/11 5:29

Getting a Gemini API key is an exercise in frustration

## Japanese Translation: **概要** 著者はReactのサイドプロジェクトを開始し、Claude Code をコーディング支援として利用していましたが、Google の Gemini 3 Pro を試すことにしました。Gemini の設定は難航しました:AI Studio で API キーを作成した後、Cloud Console にて課金情報を設定し、政府発行の ID(カード番号を伏せた PNG)をアップロードする必要がありました(JPG/PDF は拒否されました)。プロジェクトを再度関連付けるたびにクォータ階層が Tier 1 に変わるまで繰り返し作業しました。この間、CLI/API 呼び出しは 403 PERMISSION_DENIED エラーを返し、Playground は内部エラーを投げました。後日受信したメールで「Your Google Cloud and APIs billing account … is in good standing」と確認され、すべてのインターフェースで問題が解消しました。 Gemini は単一製品ではなく、チャットボット・モバイルアプリ・音声アシスタント・Workspace 機能・CLI・IDE 拡張機能を含みますが、簡易的な「Buy Now」ボタンは存在せず、プロプランの購入には AI Studio → Cloud Console を経由する必要があります。対照的に Anthropic と OpenAI は明確な消費者向け購入オプションを提供しています。 著者は Gemini 3 Pro を最大 1か月間試験しつつ、オンボーディングが煩雑であれば他のプロバイダーへ戻る可能性があります。エンタープライズ中心の設定は個人開発者や小規模チームを遠ざける恐れがあり、その結果需要はよりアクセスしやすい競合製品にシフトし、Google が将来の AI 製品を設計する際に影響を与える可能性があります。