フォース? 本当ですか!?

2026/02/06 22:54

フォース? 本当ですか!?

RSS: https://news.ycombinator.com/rss

要約

Japanese Translation:


Summary

この記事は、FORTH スタイルの結合/適用言語構文をトランスフォーマーアーキテクチャに組み込むことで、連結を優先しスタック状態の一貫性を保つことによってデータベース操作を改善できると主張しています。これは、テーブル A と B の自然結合例で示されており、従来の

BUILD PROBE
シーケンスがローカルに結合的な「横方向渡し」変換で置き換えられることを示しています。

DUP STATS SWAP BUILD
[PUSHDOWN] DIP PROBE

著者はまた、データベース層の最適化パスとしてテキスト部分列に対する有限オートマトン変換を使用することも提案しています。

語順がトランスフォーマー性能に与える影響を評価するために、ベンチマーク実験では注意力トランスフォーマーが数列からパリティツリーを構築できるかどうかをテストしました。この研究はプレフィックスとポストフィックス表記を比較しています:プレフィックスはサブ回答を生成する前に全体のパリティを知っている必要があります(トップダウン)、一方ポストフィックスはサブ回答を先に生成します(ボトムアップ)。結果は、Opus と Haiku の 2 つのモデルで収集され、第三のモデル Sonnet はまだ分析中です。

主要な結果

モデル試行タイププレフィックス精度ポストフィックス精度
OpusThinking98.3 %81.3 %
OpusNon‑thinking50.0 %9.7 %
HaikuThinking88.3 %36.7 %
HaikuNon‑thinking6.7 %4.3 %

すべての試行で、ポストフィックスは一貫してプレフィックスより優れており、Opus は Haiku を常に上回っています。

この記事は、結合的変換を適用することでデータベース結合やその他のデータ集約タスクを合理化できると結論付けています。Sonnet でのさらなるテストが予定されており、これらの利点が確認できれば、このアプローチはトランスフォーマー ベースのシステムやデータベースエンジンに新しい最適化手法を提供し、計算オーバーヘッドを削減し大規模データアプリケーションでの性能向上につながる可能性があります。

本文

コロンの後に続く単語を生成しなければならないと想像してみてください。
その空白に何を書きますか? 質問が先に来る方が簡単です。

しかし、もし構文上で「空白」をまず生成させ、そのあとにそれを構成する部分を作らなければならないとしたらどうでしょう。LLM は素晴らしいですが、人間のトップダウン的な再帰分解を試みる人が多すぎます。そこで私は、FORTH や結合型/適用型言語がトランスフォーマー構造により良いかもしれないと考えました:統合ではなく連結で;スタック状態については合意するだけ。

この仮説を検証したいと思います。


横方向パッシングジョイン

以下のプログラムがあるとします。

A SCAN [foo > 5] FILTER
B SCAN [foo < 5] FILTER
BUILD
PROBE

これは A と B の共通識別子に対して自然結合を行います。
結合型言語の特性により、局所的な編集は常に可能です。たとえば sed 的な変換であれば、

BUILD PROBE
を次のように置き換えることで横方向情報パッシング結合を実現できます。

DUP STATS SWAP BUILD
[PUSHDOWN] DIP PROBE

この同一性は、プログラムを「コンテキスト内で生成されたもの」と「まだ生成されるべきもの」に分割できることも示します。トークンを 1 つずつシャッフルしながらコンテキストを拡張し、トークン生成への欲求を消費していくわけです。

有限オートマタの部分列に対する変換がデータベース層の最適化パスを書き込む手段になると直感します。マンフリッツ・フォン・チュンの言葉を借りれば「構文的連結は意味的合成だ」。


ベンチマーク

この点でモデルが何をできるかを測定したいと思いました。注意機構付きトランスフォーマーにとって語順は重要でしょうか?実験は簡単です。数列から木構造を作り、木が指示に従う時点を測ります。サブツリーの子ノード合計が偶数か奇数かを判定する「パリティ」を使い、プレフィックス表記では全体の答えを先に知ってから部分的な答えを生成し、ポストフィックス表記では下位から上位へと逆順で生成します。

「次のトークンは何か?」という問いに対する回答方法を考えると、私の意図が分かるでしょう。

セットアップ

  • 与えられるもの:数列
  • 作るもの:プレフィックスまたはポストフィックスパリティ木

パリティ木とは、左寄りか右寄りに偏った不均衡な二項木で、葉が数値、内部ノードがその子孫全体の偶奇性を表すものです。

結果

Opus と Haiku で四つの試行を行いました(Sonnet は結果がまだ十分に理解できていないため公開前に検討中)。思考的アプローチは非思考的より優れました。Opus は常に Haiku を上回り、ポストフィックスはプレフィックスよりも優れていました。

モデル思考 (Yes/No)ポストフィックス正解率プレフィックス正解率両方正しいポストフィックスのみプレフィックスのみ両方間違い
Haiku (Yes)88.3 %36.7 %110155035
Haiku (No)6.7 %4.3 %9114276
Opus (Yes)98.3 %81.3 %2435214
Opus (No)50.0 %9.7 %281221149

これらはすべて意味のある結果です。

同じ日のほかのニュース

一覧に戻る →

2026/02/07 6:51

**OpenCiv3:サイクリズム・III のオープンソースでクロスプラットフォーム化した再構築**

## Japanese Translation: OpenCiv3は、Civilization IIIのオープンソースでクロスプラットフォームなリメイクであり、レガシー制限を取り除き、モッドサポートを拡張しつつもコアゲームプレイを保持します。Godot EngineとC#で構築されており、Windows、Linux、macOS上でネイティブに動作し、専用のCivilization IIIファイルは不要です(ただしローカルコピーがあると互換性が向上します)。 現在のプレアルファ版(v0.3「Dutch」、2025年12月)は、OS固有のzipまたはtgz(「スタンドアロンモード」でプレースホルダーグラフィック付き)として配布されます。インストール手順は以下の通りです。 - **Windows** – zipを解凍し、`OpenCiv3.exe` をダブルクリックします。ブロックされている場合は解除し、自動検出できない場合は環境変数 `CIV3_HOME` にCivilization IIIフォルダーのパスを設定してください。 - **Linux** – `.tgz` を解凍し、`export CIV3_HOME="/path/to/civ3"` としてから `OpenCiv3.x86_64` を実行します。 - **macOS** – zipを解凍し、`xattr -cr /path/to/OpenCiv3.app` でクォータリゼーションを解除し、同様に `CIV3_HOME` を設定してターミナルから起動します。 既知の問題としてはプレースホルダー資産、不完全なBIQ/SAVファイルサポート(クラッシュを引き起こす可能性があります)、および新規ゲーム開始時にマップ生成用保存ファイルが欠如しているためmacOSでクラッシュするケースがあります。最低ハードウェア要件はまだ公開されていません。プロジェクトはMITライセンスの下でリリースされ、Firaxis、CivFanatics.com、その他の団体とは独立しています。 開発者はBIQ/SAVサポートの完全復元、プラットフォーム別クラッシュ(特にmacOS)の修正、後半ゲームコンテンツの追加、およびグラフィックと安定性の向上に積極的に取り組んでいます。バグや機能要望はGitHubで追跡されており、コミュニティからの貢献が奨励されています。 モッドフレンドリーでクロスプラットフォームな基盤を提供することで、OpenCiv3はプレイヤーと開発者にオリジナルIPを侵害せずにクラシックなCivilization体験を拡張する機会を提供します。

2026/02/07 1:20

Waymoワールドモデル

## Japanese Translation: > **Waymoは、Waymo World Modelという生成シミュレーションエンジンを公開しました。このエンジンは、極端な天候・自然災害・象やロングホーンのような珍しいオブジェクト、逆走トラックなど安全に関わるインシデントを含むハイパーリアリスティックな自律運転シナリオを生成します。** > Google DeepMind の Genie 3 をベースにしたこのモデルは、カメラと LiDAR データを融合し、ドライビングアクション制御・シーンレイアウト制御・時間帯、天候、カスタムシナリオを調整する言語プロンプトという3つの制御機構を提供します。録画済みまたは新規生成されたルートに対して代替ドライビング決定を評価する「what‑if」反実仮想シミュレーションもサポートしています。 > Waymo Driver は米国都市で約 2 億マイルの完全自律走行距離を記録し、数十億マイルに相当するバーチャル走行をシミュレートしてきました。World Model はリアルなダッシュカムやモバイルカメラ映像を多模態シミュレーションへ変換し、正確な視覚シーンと一致させることでこの機能を拡張します。効率的なバリアントは実時間の最大4倍速で動作し、計算資源を削減しつつ長時間テストが可能です。 > このシステムは、安全性が証明された自律運転を実現するために Waymo の AI エコシステムの重要柱となっており、Waymo と Google DeepMind からなる大規模チームによって開発されています。

2026/02/05 20:19

**ジオジョインをH3インデックスで400 倍高速化した手法** - **問題点:** 大規模な空間データセットに対する従来のジオジョインクエリは、ポイント‐イン‐ポリゴン判定やテーブル全体のスキャンが必要だったため遅延が大きかった。 - **解決策:** Uber の H3 ヘキサゴナル階層インデックスシステムを利用し、空間情報を固定サイズセルへ事前集約した。 - **実装手順:** 1. すべてのジオメトリ(点・線・多角形)を適切な解像度で対応する H3 インデックスに変換する。 2. 生成されたインデックスを別テーブルに格納し、H3 キーで索引付けする。 3. ジョイン時には、重複した H3 インデックスをキーとしてマッチさせ、膨大な空間判定処理を回避する。 - **結果:** クエリ遅延が数時間から数分へと短縮され、約 400 倍の高速化を実現。また、選択した解像度内であれば空間的正確性は維持された。 ジオメトリ比較を単純な整数キー検索に置き換えることで、データの忠実度を損なうことなく大幅なパフォーマンス向上を達成しました。

## Japanese Translation: ## Summary この記事は、コストの高い空間述語をH3ベースの集合演算に置き換えることで、遅い二次元空間結合をコンパクトなキーで高速ハッシュ結合へと変換する方法を示しています。各ジオメトリを解像度 3 の少数の H3 セルで覆うことにより、結合は最初にセルを共有する候補ペアをフィルタリングし、その後で正確な `ST_Intersects` をその候補のみに適用します。これにより、潜在的に何百万もの交差チェックが、フィルタ済みセットだけに減少し、テストで 400 倍の速度向上を実現しています。この手法は CTE、ビュー、およびサブクエリとシームレスに機能し、追加のマテリアライズドテーブルやスキーマ変更は不要です。したがって、精度を下げるなどの実験も容易になります。高い H3 解像度では偽陽性が減少しますが、形状ごとのセル数が増加し、低解像度ではインデックス作成が簡単ですが、解像度 4 を超えるとセル数の増加により急激に大きくなります。実際には、この書き換えにより 15 ワーカーの Xeon クラスターで結合時間を約 459 秒から約 1.2 秒へ短縮し、正確な一致精度(最終的な `ST_Intersects` によって偽陽性が除去される)を維持したまま高速な空間分析を可能にしています。