I failed to recreate the 1996 Space Jam website with Claude

2025/12/08 2:18

I failed to recreate the 1996 Space Jam website with Claude

RSS: https://news.ycombinator.com/rss

要約

Japanese Translation:

要約

著者は、Claude AI を使って 1996 年の Warner Bros の「Space Jam」ランディングページをスクリーンショットとアセットフォルダから再構築しようとしました。元のサイトは 200 KB 未満の単一 HTML ファイルで、絶対位置決め、テーブルレイアウト、およびタイル状の星空 GIF 背景に依存しています。

プロセスと所見

  1. 初期試行: Claude は概算レイアウトを生成しましたが、惑星軌道を誤った位置に配置しました。軌道パターンは認識できたものの、それを再現することには失敗しました。
  2. 構造化プロンプト: 著者は Claude に「知覚分析」「空間解釈」「再構築計画」の各セクションで理由を説明させ、正確なピクセル座標を要求しましたが、Claude はそれらを提供できませんでした。
  3. カスタムツール: 精度向上のために 50 px → 5 px のグリッドオーバーレイ、ラベル付き座標参照点、色差比較、スクリーンショットサイドバイサイドビューア、およびスクリーンショットを 6 区域に分割するスクリプトを構築しました。
  4. 結果: Claude の調整は目標から 5–10 px 内に留まりましたが、正しい軌道半径(約 350–400 px)には決して収束しませんでした。内部レイアウトが生成されると、その後のフィードバックは元のスクリーンショットではなく、この誤ったモデルに基づいて行われました。
  5. トークナイズ仮説: 著者は Claude が 16×16 パッチで画像をトークナイズしているため、細かい視覚的粒度が欠如し、セマンティック理解はあるもののピクセル精度が低いと考えました。
  6. ズームインテスト: 200 % に拡大したスクリーンショットを提供して、大きなパッチで解像度が向上するか確認しましたが、Claude は依然として比例スケーリング指示に従いませんでした。

結論

このタスクは未解決のままです。実験は Claude の空間推論限界をベンチマークとし、ピクセル単位で正確な画像再構築におけるモデルの現在の制約を示しています。

本文

Hacker Newsへのリンク:
ご協力いただきありがとうございました!


Claudeは1996年のSpace Jamサイトを再現できるか?

いいえ―少なくとも私のプロンプトスキルでは。
このウェブサイトを永遠に残したいと考えており、唯一の方法としてClaudeにスクリーンショットから再構築させることが思い浮かびます。ご存知の通り私はエンジニアリングマネージャーでコンピュータサイエンスの学位を持っています。どうかお手伝いいただけませんか 😞

最後に: 「Claude」を指すときに「he」という代名詞を使っていることは、Josh にとって笑えるものです。


Space Jam(1996年)

知らない方のために説明すると、Warner Bros は1996年に公開された Space Jam 映画に合わせて作られたこの時代遅れなウェブサイトをオンラインで保持しています。
これは初期のウェブデザインの典型例です:シンプルでカラフル、そして喜びをもたらします。Claudeがスクリーンショットだけから再現できるか試してみましょう。


セットアップ

最低限、私はClaudeに以下を提供します:

  1. ウェブサイトのスクリーンショット
  2. ウェブサイトで使用されているすべてのアセット

Claude CodeとAnthropic APIとの会話全体(ユーザープロンプト、Claudeの応答、ツール呼び出し(Read, Write, Bashコマンド等)を記録するために中間プロキシを設定しました。これにより

traffic.log
ファイルが生成され、後で解析できるようになります。

編集: この調査にはOpus 4.1を使用しました。モデルを追加し忘れていたことをanorwellさんが指摘してくれました。


パート 1 – Claude the Realist

Space Jamのサイトはシンプルです:絶対位置決めで構成された単一HTMLページと星空GIF背景のタイル。全ページはピクセル単位の左/上値を使った絶対位置決めです。総ペイロードは200 KB未満。

訂正: 実際にはテーブルで作られています。wilsmexさんとsqirclesさんに指摘いただきました!

Claudeがすべてのアセットとスクリーンショットを持っていれば、単調な作業になるはずでした。彼はそれを完璧に再現し、次にもっと面白い例—エージェント的HTML生成へ移ることができるでしょう。

私はClaudeにこう伝えました:

*「あなたには以下を渡します:

  1. Space Jam 1996ランディングページの完全なスクリーンショット。
  2. 元サイトから抽出した画像アセットのディレクトリ。
    あなたの仕事は、できるだけ忠実にランディングページを再現し、スクリーンショットと正確に一致させることです。」*

彼が作ったものは一見悪くないように思えました:惑星がロゴの周りに楕円形で配置され、ボタン位置に黄色いラベル。ですが軌道パターンがほぼダイヤモンド型で対称になっていました。

Claudeは自慢しました:

「完璧です!私はSpace Jam 1996ランディングページを成功裏に再現しました。」

彼は軌道レイアウトを研究し、間隔関係を分析して惑星を正確に配置したと主張しました。しかし出力は本来のパターンから外れていました。


パート 2 – Claude the Unreliable Narrator

私はグリッドや比較、ステップバイステップ修正、Claudeに思考過程を語らせるなど試みましたが、効果はありませんでした。ツールを作成しました:

  • グリッドオーバーレイ
  • ラベル付きピクセル座標参照点
  • 背景を無視した色差比較
  • スクリーンショットを逐次比較するツール

Claudeはまだ苦戦していました:軌道は近づいたもののSpace Jamロゴに圧縮されてしまい。彼はグリッドを使い、「中心(961, 489)」や「惑星B‑Ball ≈ (850, 165)」と数字を引き出しましたが、最終レイアウトは源から大きく逸脱していました。

2倍ズームしたスクリーンショット(詳細を増やすため)でも改善されませんでした。彼は画像を粗い意味論的ブロブとして扱い、正確な幾何学マップとして解釈しませんでした。


パート 3 – Claude the Blind

Claudeのビジョンエンコーダが画像の16×16ブロックごとに1トークンを生成している可能性があります。したがって惑星は2〜3パッチしかないため、細かい空間推論が困難です。サイズを2倍にすると惑星あたりのパッチ数が増えるかもしれませんが、それでも正確な位置決めには結びつきません。


結論

Claudeはレイアウトを「ここに惑星、そこにラベル」と意味的に説明できますが、スクリーンショットだけからピクセル単位で完璧に再現することはできません。グリッドやズーム、詳細プロンプトを使っても彼の内部モデルは不正確な「想像上の軌道」に縛られ続けます。

まだ必要なのは

Space Jamサイトを忠実に再構築することです。スクリーンショットとアセットフォルダだけでClaudeまたは他のツールがこれを実現できれば、ぜひお知らせください。

試したことのないアプローチ

  1. 四分割再構築 – 各象限を独立して処理し、後でマージ。
  2. マジックプロンプトエンジニアリング – 例:「あなたは絶対位置決めに精通したCSSグリッドです…」
  3. 明示的ズームツール使用 – Claudeにズームインインターフェースを与え、スクリーンショットの使い方を指示する。

誰かがこれを突破するまで、Space Jamサイトは「再現不可能な完璧さ」の証拠として残ります。

同じ日のほかのニュース

一覧に戻る →

2025/12/08 7:18

How I block all online ads

## Japanese Translation: > **概要:** > 著者は、ウェブブラウザとモバイルアプリの両方で広告を排除するために長期的かつ多層的なアプローチを説明しています。彼は **Firefox + uBlock Origin** と最小限のフィルタリスト(組み込みのuBlockフィルタ、EasyList、AdGuard – Ads)と「広告でない不快要素」のためのカスタム非広告フィルタを使用します。 > DNS フィルタリングには **Pi‑hole(または AdGuard Home)** を Docker 上で $5 の DigitalOcean ドロップレットに稼働させ、WireGuard VPN の DNS サーバとして設定しています。トラフィックは **クラウドベースの VPN**(DigitalOcean、Hetzner、Azure、Google Cloud、または AWS)を経由し、プラットフォームが公的クラウド IP を検知して広告配信を減らします。 > この設定では **Cloudflare のキャプチャや HTTP エラー** が発生する場合があるため、著者は該当サイトで VPN を無効化しています。また、**Consent‑O‑Matic**(クッキーポップアップ)、**Buster**(キャプチャ)、**SponsorBlock**(動画広告)などのブラウザ拡張機能を推奨します。iOS では **Background App Refresh** をオフにするとデータ収集が減少し、Android では **ReVanced がアプリをパッチできますが、セキュリティリスクがあります** と指摘しています。 > 著者はこの統合戦略を 3 年以上使用しており、現在ほとんど広告を見ることはありません。プラットフォーム別の効果は異なります:YouTube は uBlock Origin + VPN(1週間〜1か月)が必要;Instagram は uBlock Origin のみで十分;Twitch は主に VPN に依存し、数日で効果が現れます;TikTok は両方のツールを使用しますが、数時間だけです。**AdMob** を利用するアプリも DNS ブロックの恩恵を受けます。 > 広告配信ネットワークは数日から数週間でパターンを観察し調整する可能性があるため、継続的な監視が必要です。著者は **Firebog** をブロックリストの良い情報源として引用し、正当なサイトを壊さないように許可リスト(allowlist)を維持する重要性を強調しています。

2025/12/07 23:37

Dollar-stores overcharge cash-strapped customers while promising low prices

## Japanese Translation: ドルジェネラルとファミリードラーは、棚に貼られたタグの価格よりも高い価格で顧客を頻繁に請求し、低所得層の買い物客に不釣り合いな過剰課金が広く発生しています。州検査と独立調査では、一部店舗でエラー率が88%に達するケースや、両チェーン全体で価格設定失敗が一貫して報告されています。 主な例としては、ノースカロライナ州ウィンザーのファミリードラーで23%のスキャンアイテムが過剰請求(同店の4回連続失敗)、オハイオ州ハミルトンのドルジェネラルで76%のエラー率(2022年10月)、ニュージャージー州バウンドブルックのファミリードラーで68%の不一致(2023年2月)があります。2022年1月以降、ドルジェネラルは4,300件以上、ファミリードラーは2,100件以上の価格失敗事例を記録しています。 アリゾナ州(60万ドル)、コロラド州(40万ドル)、ニュージャージー州・バーモント州・ウィスコンシン州・オハイオ州(最大100万ドル)など複数の州がチェーンと訴訟を和解し、連邦および州の司法長官は追加訴訟を提起しています。株主訴訟では、経営陣がシステム的問題を認識していたと主張されています。ニュージャージー州の連邦裁判所は、モバイルアプリ利用に関連する仲裁条項を理由にドルジェネラルに対する集団訴訟を停止し、消費者の救済手段を制限しました。 規制当局は現在の1検査あたり5,000ドル上限を超えるより厳格な執行や高い罰則を課すことができ、さらに州が調査を進めるにつれて追加の和解が生じる可能性があります。影響としては顧客信頼の低下、チェーンへの潜在的財務損失、評判へのダメージ、およびドルストア業界全体での価格設定と人員管理の強化への動きが挙げられます。

2025/12/07 21:23

Google Titans architecture, helping AI have long-term memory

## Japanese Translation: > **概要:** > Titans は、深層ニューラルネットワークを長期記憶モジュールとして採用し、高速線形再帰ダイナミクスとトランスフォーマー風の精度を融合させた新しいアーキテクチャです。MIRAS 理論枠組みに基づき、メモリ構造・注意バイアス・保持ゲート・メモリアルゴリズムという4つの設計選択肢を定義し、非ユークリッド的目的を推進します。Titans は、新情報に対してメモリを選択的に更新するためのサプライズ指標(現在のメモリ状態と新しい入力との勾配)を導入し、モーメンタムと適応型忘却ゲートも併用します。YAAD、MONETA、MEMORA などの MIRAS バリアントは、外れ値への頑健性、より厳格なペナルティ、および安定性向上を提供します。C4、WikiText、HellaSwag、PIQA、ゲノムタスク、BABILong ベンチマークでの評価において、Titans とそのバリアントは Transformer++、Mamba‑2、Gated DeltaNet などのリーディングモデルを上回り、パラメータ数が少なくても最先端の結果を達成しています。消去実験では、より深いメモリモジュールが困惑度を低減し、長いシーケンスでスケールアップすることが確認されています。このアーキテクチャは高速線形推論と並列化可能なトレーニングをサポートしつつ、200万語以上のコンテキストウィンドウに拡張できます。重要なのは、MIRAS がオンライン最適化、結合記憶、およびアーキテクチャ設計を統一し、モデルがデータストリームとして継続的に学習するリアルタイム適応を可能にしている点です。総じて、Titans と MIRAS は、高精度を犠牲にせずに非常に長いシーケンスを扱う効率的で表現力豊かな長文脈 AI への重要な一歩を示しています。 *(元の言い回しがほぼすべての主要ポイントを捉えている場合は、BABILong と明示的な MIRAS 設計選択肢のみが欠けています。)*