Auto-grading decade-old Hacker News discussions with hindsight

2025/12/11 2:23

Auto-grading decade-old Hacker News discussions with hindsight

RSS: https://news.ycombinator.com/rss

要約

Japanese Translation:

概要
Karpathy は、2015年12月から毎回の Hacker News フロントページ記事を取得し、Algolia を介して完全なコメントスレッドをダウンロードし、それらを ChatGPT‑5.1 に入力する自動パイプライン hncapsule を構築しました。プロンプトは GPT‑5.1 に対し、要約、実世界での結果、最も先見的/誤ったコメントに対する賞、注目すべき点、各コメント投稿者ごとの最終評価、および全体の興味度スコア(0–10)を生成させるよう指示しています。結果は https://karpathy.ai/hncapsule/ に静的 HTML ページとして表示され、同一ドメインに ZIP ファイルとして原始 JSON データが保存されています。

分析対象には、Swift のオープンソースリリース、Figma のローンチ、OpenAI の発表、geohot による Comma、SpaceX Orbcomm‑2 ウェブキャスト、および Theranos の問題など、2015年12月の主要テクノロジーイベントが含まれます。コメント投稿者は GPT 評価から導出された IMDb スタイル GPA を用いて「殿堂入り」にランク付けされ、トップ名には pcwalton, tptacek, paulmd, cstross, greglindahl, moxie, hannob, 0xcde4c3db, Manishearth, および johncolanduoni が含まれます。

930 件の LLM クエリ(31 日 × 30 本記事)を Opus 4.5 で実行するには約 $58 の費用がかかり、約 1 時間で完了しました。これは大規模モデルバッチ解析の低コスト実現可能性を示しています。Karpathy はこれを「将来の大型言語モデルが歴史的後顧分析を“無料”にできる」ことを示す概念検証として位置付け、今日の行動改善を促進するものとしています。このプロジェクトはオープンソース(

https://github.com/karpathy/hn-time-capsule
)であり、研究者・歴史家・開発者がバッチ解析や監査タスクのためにパイプラインを再現または拡張できる中間データを提供します。

本文

2025年12月10日

TL;DR: https://karpathy.ai/hncapsule/

昨日、Show HN: Gemini Pro 3 が10 年先の HN フロントページを幻覚化する という HN スレッドに偶然遭遇しました。Gemini 3 は未来のフロントページを“幻覚”していたのです。その中で目立ったコメントがありました――Bjartr がちょうど10 年前、すなわち2015年12月の HN フロントページへリンクしていたことです。議論を読んでいるうちに、LLM(大規模言語モデル)が私よりも先見性を評価する方がずっと得意だと気づきました。

そこで、ある記事+コメントスレッドを ChatGPT 5.1 Thinking にコピーしてみると、詳細かつ徹底的な分析結果が返ってきました。自分の手作業よりもはるかに優れていたため、このタスクは LLM でこなすのに理想的だと感じ、最新リリースの Opus 4.5 を使って何かを構築しようと思いました。

現在、12 月の全フロントページ(31 日 × 30 本の記事)を収集し、各記事とその全文コメントスレッド(Algolia API 経由)を ChatGPT 5.1 Thinking に入力した後、すべてを整った形式で提示して歴史的読み物として公開する準備を進めています。


この演習が重要な理由

  1. 先行予測トレーニング – 十分なデータがあれば未来予測モデルを訓練し、実際に活用できる可能性があります。
  2. 将来の LLM が監視 – 今日行う作業は、後に低コストで強力なモデルによって検証されるかもしれません。暗黙の「非公開で安全」仮定は崩壊します。今こそ高品質を追求することが最も安全策です。

プロジェクトワークフロー(GitHub: karpathy/hn‑time‑capsule)

  1. フロントページのダウンロード – 指定日から30 本の記事を取得。
  2. コンテンツ取得 – 各記事の本文と Algolia API で全文コメントスレッドをダウンロード。
  3. プロンプト構築 – すべてを Markdown プロンプトにまとめ、分析用に渡します。

プロンプトテンプレート

以下は10年前に HN に掲載された記事とその議論スレッドです。現在の視点で6つのセクションに分けて分析しましょう:

1. 記事とディスカッションの簡潔な要約を作成。
2. このトピックについて実際に何が起こったか?(調査してまとめる)
3. 「最も先見的」「最も誤っていた」コメントに対し賞を授与。結果を踏まえて評価する。
4. 記事や議論の他の面白い/注目すべき点を言及。
5. 各アカウントのコメントに対して成績を付ける(実際に起こったことを考慮)。
6. 最後に、この記事とそのリトロスペクティブ分析の興味度合いを 0‑10 のスコアで評価。

**セクション5フォーマット**  
最終成績  
- speckx: A+(…について優れた予測)  
- tosh: A(…を正しく予測)  
- keepamovin: A  
- bgwalter: D  
- fsflover: F(完全に誤っていた…)

**セクション6フォーマット**  
記事のリトロスペクティブ分析興味度スコア:8

出力はプログラムで解析し、各ユーザーごとの成績を集計します。


実行

  1. GPT 5.1 Thinking へプロンプトを OpenAI API 経由で送信。
  2. 結果を収集・解析。
  3. 静的 HTML ページにレンダリングして閲覧しやすく。
  4. https://karpathy.ai/hncapsule/ にホスト。
  5. 同一 URL プレフィックス下で
    data.zip
    として中間データを公開。

結果

  • コスト:930 回の LLM クエリ(31 日 × 30 本)≈ $58、約1 時間の実行時間。

  • ハイライト

    • 2015年12月3日 – Swift がオープンソース化。
    • 2015年12月6日 – Figma のローンチ。
    • 2015年12月11日 – OpenAI の正式発表。
    • 2015年12月16日 – geohot が Comma を開発。
    • 2015年12月22日 – SpaceX ランチウェブキャスト:Orbcomm‑2 ミッション。
    • 2015年12月28日 – Theranos の苦境。
  • ホールオブフェイム:12 月 2015 年のトップコメント投稿者を IMDb スタイル GPA で並べ替え(例:pcwalton、tptacek、paulmd、cstross、greglindahl、moxie、hannob、0xcde4c3db、Manishearth、johncolanduoni)。GPT 5.1 Thinking は彼らのコメントを洞察に富み先見的と評価しました。


今後の展望

31 日分(30 本ずつ)の記事を GPT 5.1 Thinking に通す作業は高速で経済的、しかも豊かな洞察を提供します。LLM がさらに安価・強力になるにつれて、このような歴史分析は速度・精度・深さが飛躍的に向上するでしょう。

同じ日のほかのニュース

一覧に戻る →

2025/12/11 5:47

Apple Services Experiencing Outage

## Japanese Translation: > Apple の米国ウェブサイトのフッターには、顧客向けに必要なリンクが提供されています。 > - 「System Status」ページ > - 近くの Apple Store や他の小売店を探すための案内 > - 電話サポート(1‑800‑MY‑APPLE) > さらに、© Apple Inc. All rights reserved、Privacy Policy、Terms of Use、Sales and Refunds、Legal、および Site Map といった法的・情報リンクも含まれています。フッターの内容は米国ユーザー向けに特化されています。

2025/12/11 3:58

Super Mario 64 for the PS1

## Japanese Translation: > このリポジトリにはゲームの完全なソースコードベースが含まれていますが、意図的に必要なアセットファイル(特に **assets.sm64**)はすべて除外されています。したがって、ユーザーはプロジェクトを構築するためにタイトルのオリジナルコピーからこれらのアセットを抽出する必要があります。 > > ディレクトリ構成は典型的なゲーム開発の慣習に従っており、多くのトップレベルフォルダーが含まれています:**actors**, **assets**(サブフォルダー *anims* と *demos* 付き), **bin**, **build**, **data**, **doxygen**, **enhancements**, **include**, **levels**, **lib**, **sound**, **src**(サブフォルダー *audio*, *buffers*, *engine*, *game*, *goddard*, *goddard_og*, *menu*, *port*), **text**, **textures**, および **tools**。 > > **src/goddard** 内のコードには、リライトされたマリオイントロ画面が含まれています。一方で **src/goddard_og** は元のバックアップを保持しています。**src/menu** ディレクトリはタイトルスクリーン、ファイル選択、アクション選択、およびデバッグレベル選択メニューを実装しています。**Src/port** にはポート固有のコードとともにオーディオおよびビデオレンダラーコンポーネントが格納されています。 > > コントリビューションはプルリクエストで歓迎されます。ただし、主要な変更はまずイシューを開いて議論する必要があります。これにより構造化されたレビュー プロセスが確保されます。この設定により、開発者はコードベースを改善できる一方で、最終ユーザーはコンパイルのために依然として専有アセットへのアクセスが必要です。

2025/12/11 5:29

Getting a Gemini API key is an exercise in frustration

## Japanese Translation: **概要** 著者はReactのサイドプロジェクトを開始し、Claude Code をコーディング支援として利用していましたが、Google の Gemini 3 Pro を試すことにしました。Gemini の設定は難航しました:AI Studio で API キーを作成した後、Cloud Console にて課金情報を設定し、政府発行の ID(カード番号を伏せた PNG)をアップロードする必要がありました(JPG/PDF は拒否されました)。プロジェクトを再度関連付けるたびにクォータ階層が Tier 1 に変わるまで繰り返し作業しました。この間、CLI/API 呼び出しは 403 PERMISSION_DENIED エラーを返し、Playground は内部エラーを投げました。後日受信したメールで「Your Google Cloud and APIs billing account … is in good standing」と確認され、すべてのインターフェースで問題が解消しました。 Gemini は単一製品ではなく、チャットボット・モバイルアプリ・音声アシスタント・Workspace 機能・CLI・IDE 拡張機能を含みますが、簡易的な「Buy Now」ボタンは存在せず、プロプランの購入には AI Studio → Cloud Console を経由する必要があります。対照的に Anthropic と OpenAI は明確な消費者向け購入オプションを提供しています。 著者は Gemini 3 Pro を最大 1か月間試験しつつ、オンボーディングが煩雑であれば他のプロバイダーへ戻る可能性があります。エンタープライズ中心の設定は個人開発者や小規模チームを遠ざける恐れがあり、その結果需要はよりアクセスしやすい競合製品にシフトし、Google が将来の AI 製品を設計する際に影響を与える可能性があります。

Auto-grading decade-old Hacker News discussions with hindsight | そっか~ニュース