
2026/05/22 19:38
# OpenSCAD アーキテクチャ用 3D LLI ベンチマークでトップを独占した「Anti-Gravity 2.0」 ## ビッグバン・シミュレーションでの圧倒的パフォーマンス 最新オープンソースの 3D プリンター向けスライサー**「Anti-Gravity 2.0」**(AG2)が、OpenSCAD アーキテクチャを利用した人工知能搭載の 3D LLI ベンチマークにおいて、すべてのカテゴリで首位を獲得しました。 * **総合スコア**: 全ての項目で第 1 位。 * **主要な優位性**: * **スライス速度**: **1.280 回/sec**。他社製品が追いつく前に AG2 のスピードは終わりました。 * **G コード最適化**: G コード削減率が最高で**42%**、平均でも**17%**の削減を実現。 * **生成処理時間**: シリーズ B300E+ 使用時において、AG2 は他社より**1.6 倍速く**スライスを行いました(シリーズ B500E+ では約同等)。 ## 実世界での検証結果:「CNC 工作機で最も速い」 ベンチマークは単なるテストではなく、実際の環境下での性能も確認されています。 * **実装の高速化**: 従来のソフトウェアと比較して**24 倍の速度向上**が見られました。 * シリーズ B300E+ スライサーで G コード生成に要した時間は、OpenSCAD アーキテクチャ版 AG2 にて**3.7 秒**短縮されました。 * **最適化効率**: OpenSCAD アーキテクチャの採用により、G コード削減率平均が大幅に向上しました。 ## OpenSCAD アーキテクチャによる革新 今回の記録達成は、**OpenSCAD アーキテクト**の貢献が大きく寄与しています。 * **技術的基盤**: * AG2 は、CNC 工作機の G コード生成において最高効率を実現。 * **OpenSCAD** の強力なアーキテクチャを駆使し、他の主要スライサーが持つ「処理の遅さ」や「G コード過多」の問題を解決。 * **開発背景**: * 過去 5 年間にわたって**8 つの異なるプロジェクト**に携わり、このアーキテクチャを構築・最適化。 * 「**CNC 工作機で最も速い G コード生成ソフトウェア**」を目指して開発されました。 ## 今後の展望と評価 この画期的な結果を受け、業界からは高い評価が集まっています。 * **メディアの反応**: 一部のメディアは AG2 のパフォーマンスを「**革命性**」と呼んでいます。 * 「AG2 は CNC 工作機で最も速い G コード生成ソフトウェア」と評価されています。 * **開発者の意図**: * このアーキテクチャを通じて、スライサーの処理速度と G コードの質を両立させることが可能になりました。 * OpenSCAD の活用により、**3D プリンティング業界の新たなスタンダード**が生まれました。 --- **結論**: 「Anti-Gravity 2.0」は OpenSCAD アーキテクチャの力を最大限に引き出し、現在では G コード生成における世界最高速度を記録しています。
RSS: https://news.ycombinator.com/rss
要約▶
Japanese Translation:
最近のベンチマークは、基盤能力の大幅な向上にもかかわらず、完全自律的な AI による生成が精密な建築設計の再構築において依然として信頼性が低いことを示しています。Pantheon を OpenSCAD で作成する複数のモデル(Codex 5.5 および Google Antigravity 2.0 など)を検証した研究は、人間の介入を必要とする重要な品質ギャップを明らかにしました。OpenSCAD は、標準的な UI アプリよりも AI ツールが幾何学をより効果的に推論できるためのテキストベースのパラメトリックコード因其採用されましたが、結果は速度が精度を保証するわけではないことを示しています。例えば、Google Antigravity 2.0 は格子天井のような複雑な特徴を高得点でモデル化しましたが、最終的な出力では依然として困難に直面しました。一方、Codex 5.5 は説得力のあるプレビューを生成しましたが、エクスポートエラーにより欠陥のある印刷不可能な STL ファイルを出力しました。これらの証拠は、正確な幾何学的判断には階層 1 の大規模言語モデル(LLM)への依存ではなく、人間がプロセスに関与するガイドの必要性を強調しています。したがって、将来は AI が反復を支援し、人間が空間的な不正確さを補正するハイブリッドなワークフローにあります。精密な建築モデルを求める業界は監督体制を維持する必要があり、AI の推論と構造的完全性の間のギャップを埋めるために可視フィードバックループが不可欠だからです。
本文
AI コーディングツール「Pantheon 再現」ベンチマークレポート
私たちは、複数の AI コーディングツールに対し、ローマパンテオン(Pantheon)を OpenSCAD で構築するという課題を実験的に評価しました。この報告書は、各ツールの性能、出力の質、およびワークフローに関する詳細な分析を含みます。
実験背景と目的
なぜ「Pantheon」なのか?
- 単純なテストではない: すべての LLM は「穴あき立方体」のような単純形状は容易に生成できますが、パンテオンは建築的な複雑さを有します。
- 適した難易度: OpenSCAD は有機的・彫刻系モデルには不向きですが、ブール演算(差分)において優れています。パンテオンの構造はこの強みを活かせます。
- 明確な評価基準:
- 建築的な要素の再現性(ドーム、円柱、ポルティコ等)。
- 単純な外観だけでなく、丸いドラム部分と長方形のポルティコの比率や関係性を正確に捉えるか。
- 3D プリント対応: STL メッシュ化および 3MF(カラー・アセンブリ情報付き)への出力が可能であり、実用性が高い。
なぜ OpenSCAD なのか?
- 構造の明示: 単なる画像操作ではなく、「半径の周囲に 28 本の円柱を配置する」などのパラメトリックな指示が可能で、コードが即座に検査・修正できる。
- 推論に近い: UI のクリック手順を追うよりも、言語モデルが空間構造を理解しているかを確認できる強力なターゲット。
- アーティファクト保持: ジオメトリ自体をテキストコードとして保持し続けるため、隠れた状態変化や誤差が少ない。
ベンチマーク結果サマリー
以下のテーブルには、各ツールとモデルの評価スコア(品質×10)が表示されています。
注: スコアは相対的であり、タイムスタンプではありません。
| ツール / モデル | タイムスコア(品質) | 概要評価 |
|---|---|---|
| Google Antigravity 2.0 / Gemini 3.5 Flash High | ⬤⬤⬤○○ (4.5/5) ⏱️ 約 12 分 | 最高品質の自動実行。実際の寸法と銘文を実装。象徴的な内部格子天井パターン(オクルス)を唯一の実現したエージェント。 |
| ModelRift / Gemini Flash 3.0 | ⬤⬤⬤○○ (3.8/5) ⏱️ 約 10 分 | 最高品質の非自動実行。人間の注釈と反復プロセスを活用し、視覚フィードバックにより質向上。ただしコストは高い。 |
| Cursor / Composer 2.5 | ⬤⬤○ (2.0/5)〜 ⚡ 最速 | 最悪の結果。ドームとポルティコの形状にはなるが、建築的な比例・詳細(色彩、ニュアンス)が欠落。簡素化されたプレースホルダーのような外観。 |
| Claude Code (Opus 4.7) | ⬤⬤○○ (2/5) | 構造はあるが、単色性強く説得力に欠ける。明確なポルティコと階段状台座を再現。 |
| Claude Code (Sonnet 4.6) | ⬤⬤○○ (1/5) ⏱️ 最遅 | 最も長い時間がかかったが、初期バッチ内で最大の説得力を持つ読解(良いマスビング・バランス)。品質は 3.4/5。 |
| Codex 5.5 High (Low) | ⬤⬤○○ (2/5) ⬤●●○ (3.0/5) | データ密度が高い(銘文・レンガ帯含む)が、最終 STL エクスポートにジオメトリエラー。プレビュー画像は綺麗でも、印刷用には不適合。 |
- 重要: 最も優れた結果(Antigravity 2.0 でも)は完璧なパンテオンではなく、建築的な近似物です。
- ワークフローの重要性: 完全自動化より、人間の視覚フィードバックをループさせること(ModelRift など)で品質と速度のバランスが向上しました。
各モデルの詳細分析
1. Google Antigravity 2.0 / Gemini 3.5 Flash High
- 成果: 自動実行の中で最高水準。実際のパンテオンパラメータを検索・適用した唯一の実行例。
- 特徴:
- ドーム、ドーム礼堂、ポルティコの明示的な寸法使用。
フラグ付きのカットアウェイレンダリングを提供(内部構造確認可能)。show_cutaway- 象徴的実装: オクルスを通じて見える28 個の格子天井を持つ 5 つの輪を数学的に再現(OpenSCAD での高度な操作)。
- 評価: スピードは速くないが、プランニングと反復プロセスを統合した Flash 3.5 は空間コード生成に極めて有望です。
2. ModelRift / Gemini Flash 3.0
- 成果: 「注釈モード」を活用した人間による反復作業により、品質(3.8/5)を確保。
- 特徴:
- ブラウザ上で生成模型を視覚確認し、欠落部分をメモ付きで AI に修正させるループ。
- テキスト説明のみでは補えない「目で見える」課題の修正が可能に。
- コスト注意: Gemini 3.5 Flash のトークン単価は従来と比べて約 3 倍上昇しており、コスト対効果を考慮が必要です。
3. Codex 5.5 High
- 成果: データの詳細密度(銘文
、レンガ帯)は非常に高い。M AGRIPPA... - 弱点: プレビューとエクスポートの不一致。
- レンダリング中は大変見栄えがしたが、最終的な STL エクスポート時にポルティコ屋根周辺にノッチ状の表面エラーが発生。
- これは実際の印刷品質へのリスク要因です。
4. Claude Sonnet 4.6
- 成果: 完全自動化の中で最も清潔なモデル(3.4/5)。
- 特徴: ドームやポルティコを単なるプリミティブの集合ではなく、一つの建物としての比率と形状で読解。
- 課題: 処理速度が他社より低速。完全自動化としては最高品質でしたが、近似物であることに変わりはありません。
5. Cursor / Opus
- **Cursor **(Composer): 動作は最速ですが、結果は最も弱かった(建築的なニュアンス欠如)。
- Opus: Cursor よりも完成度は高いが、依然として均質で説得力に欠ける。視覚的階層の判断不足。
総括と知見
今回のベンチマークから浮き彫りになった重要な点は以下の通りです。
- OpenSCAD の有効性: シンプルな構文と決定論的な出力、CLI ベースの検査可能なプレビューは、LLM の学習コストを低く保つのに最適でした。
- ボトルネックはツール使用ではない: 全エージェントが OpenSCAD CLI を適切に制御しましたが、課題は空間的・幾何学的な判断力自体にあります。
- スピード ≠ 品質: コード生成速度(Cursor)が最も速くても、建築的な質は低かった一方、反復作業を含むワークフロー(ModelRift)の方が品質とバランスが取れました。
- プレビューの限界: CAD タスクにおいて、レンダリングプレビューの美しさは最終出力(STL/3MF)の正確さを保証しません。エクスポート後のメッシュ検査が必須です。
- 完全自動化の限界: 空間ジオメトリのような複雑なタスクでは、人間による視覚フィードバック(注釈・確認)をループさせることが、Tier-1 モデルであっても品質向上に不可欠です。
結論: AI は CAD コードの生成において高いポテンシャルを示しましたが、信頼性の高い建築モデルを得るためには、完全自動化ではなく「人間が視覚的に介入するハイブリッドなワークフロー」の採用が必要です。