大型 GPU は大きな PC を必要としません。

2025/12/21 2:49

大型 GPU は大きな PC を必要としません。

RSS: https://news.ycombinator.com/rss

要約

Japanese Translation:

Raspberry Pi 5はeGPUワークロードをサポートできますが、単一PCIe Gen 3レーン(約850 MB/s)のために、デスクトップPCで使用される≥16レーンGen 5スロットと比較して生のスループットが制限されます。Intel Core Ultra 265‑K PCとの並列テスト(Jellyfinメディアトランスコーディング:NVENCによる1080p/4K H.264/H.265ストリーム処理、GravityMark 3Dレンダリング、RTX 3060を用いた大規模言語モデル推論、およびマルチGPU拡張)では、Piのスループットは低かったものの、トークン毎ワットまたはスコア毎ワットの指標は高くなりました。アイドル電力は約4–5 Wであった一方、PC(GPUなし)は約30 Wだったため、Piのエネルギー優位性が示されました。

PiベースのeGPUセットアップ(16 GB CM5、IOボード、Minisforumドック、M.2‑to‑Oculinkアダプタ、USB‑SSD、1850 W PSU)は$350–$400で、同等のPCビルド($1,500–$2,000)より大幅に安価です。RTX 4090テストでは、大部分の大規模モデルワークロードがPC性能の約5 %以内に留まりつつ、依然として優れたエネルギー効率を提供しました。Dolphin PCIeインターコネクト(4070 Ti + A4000)を使用したデュアルGPU実験では、PiからGPUへのトラフィックで遅延が増加し、PCの単一大きなGPUよりもパフォーマンスが低下しました。マルチGPU拡張により、1枚のカードのVRAM(例:Qwen 3 30B ~18 GB)を超えるモデルを実行できましたが、依然として大型単一GPUより遅く、効率も劣ります。

総じて、Piは電力消費とコストが重要なニッチでGPU中心のワークロード(メディアサーバーやエッジAIデプロイメントなど)に優れていますが、高性能ゲーミングや計算タスクでは従来のPCが依然として有利です。これにより、コンポーネントメーカーはPi市場向けに専門的でエネルギー効率の高いGPUをターゲットする方針が形成されます。

本文

AMD、Intel、Nvidia のグラフィックカードを Raspberry Pi に接続して動かし始めてから、ずっと気になっていた疑問がありました。

「本当に意味はあるのだろうか?」

Pi には eGPU 接続用に PCIe Gen 3 の 1 レーン がしか提供されていません。
これはほとんどのデスクトップで見られる 16‑レーン Gen 5 スロット(8 GT/s 対 512 GT/s)よりもはるかに低速です。
しかし帯域幅だけがすべてではありません。


私が試した内容

カテゴリテスト
メディアトランスコーディングJellyfin
GPU に依存するレンダリングGravityMark
LLM/AI の性能Llama 3、Qwen3 など(プレフィルと推論)
マルチ GPU ワークロードデュアル GPU 実行 (LLMs)

PCIe Gen 4 外部スイッチと 3 スロットのバックプレーンを使い、2 台のカードを同時に走らせました。


TL;DR

  • 多くの場合、Pi は十分に競争力があります。
  • ピーク性能を 2–5 % 程度しか犠牲にしないなら、効率で勝つこともあります。
  • RTX A5000 を 4 台搭載した単一 Pi が Llama 3‑70b を 11.83 トークン/秒で実行—最新 Intel サーバー(12 t/s)からわずか 2 % しか遜色ありません。

ハードウェアとコスト

構成合計
Raspberry Pi eGPU$350–$400
Intel PC$1,500–$2,000
  • Pi: 16 GB CM5 + IO ボード、MiniSforum eGPU ドック、M.2‑to‑Oculink アダプタ、USB SSD(1.8 TB)、850 W PSU。
  • Intel: Core Ultra 265、ASUS ProArt マザーボード、Noctua クーラー、850 W PSU、64 GB DDR5、NVMe SSD。

電力消費: Pi のアイドルは約 4–5 W;PC は GPU を除くと約 30 W(アイドル時)。


ベンチマーク

1. Jellyfin – メディアトランスコーディング

  • Pi の PCIe ボトルネック: ~850 MB/s ピーク、USB 3.0 SSD での持続的 300 MB/s。
  • PC スループット: PCIe Gen 4 x4 SSD により >2 GB/s。

生データスループットは低いものの、Pi 上の Jellyfin は以下を円滑に処理しました:

  • 1080p と 4K の H.264/H.265 ストリームを遅延なしで再生。
  • 同時トランスコーディング(Dune 4K + Sneakers 1080p)もスムーズ。

結論: 一般家庭用メディアワークロードでは Pi でも十分。
大量のトランスコーディングが必要な場合は PC が勝ります。


2. GravityMark – GPU レンダリング

カードPi スコアPC スコア
RX 460 (Gen 3)やや高い低い
AMD カード(その他)遅い少し速い
  • 効率: Pi は古い Gen 3 GPU でスコア/ワットが Intel システムより優位。
  • 新しい Nvidia カード: PC だけでテスト(Pi ではまだディスプレイ出力なし)。

3. AI / LLM

GPUPi トークン/sPC トークン/s
AMD Radeon AI Pro R9700劣る優れる
RX 460妥当遅い
RTX 3060 (12 GB)競合的tinyllama、llama 3.2‑3B でわずかに優位
RTX 3080 Ti / 4070 Ti / A4000 / 4090ばらつきあり多くの場合高いが必ずしもではない
  • 効率: Pi は中規模モデル(例: Llama 2‑13B、Qwen3‑30B)でトークン/ワットが安定して優位。
  • 大規模モデル (>30 GB): Pi で 2 台 GPU(Radeon AI Pro + RX 7900 XT)を組み合わせると 52 GB VRAM を実現し、パフォーマンスは遅くても許容範囲。

4. デュアル GPU テスト

Dolphin の PCIe インターコネクトを使用:

  • 同一カード (RTX A5000 × 4): Pi はメモリプーリングのおかげで Intel PC にほぼ追いつく。
  • 異なるカード (4070 + A4000 など): VRAM プールが無いので、Pi を経由する北南トラフィックにより性能低下。
  • AMD ペア (Radeon AI Pro + RX 7900 XT): 52 GB VRAM。モデルによっては遅延や停止が発生。

結論: 複数 GPU は容量を増やすものの、単一大型 GPU の PC 側よりも遅く効率も劣ります。


最終的な考察

要素Pi eGPUIntel PC
生パフォーマンス多くの場合低い全体として高い
効率 (トークン/W)中規模モデルで優位大型 GPU ではわずかに優位
電力消費(アイドル)4–5 W約30 W
コスト$350–$400$1,500–$2,000
  • Pi を選ぶ場面:

    • 完全 GPU 主導の特定ニッチワークロード。
    • 低電力消費が重要なケース。
    • 予算制限がある場合。
  • PC を選ぶ場面:

    • 最大の生パフォーマンスや簡易セットアップが必要。
    • 複雑なマルチ GPU や高帯域幅ワークロード(大規模トランスコーディングファームなど)。

感謝

Micro Center による AMD Ryzen AI Pro R9700 と 850W PSU、Dolphin ICS が提供してくれた PCI Express ボードを使ったデュアル GPU テストに感謝します。

同じ日のほかのニュース

一覧に戻る →

2025/12/21 3:28

**Spotify のバックアップ**

## Japanese Translation: ``` ## Summary Anna’s Archive は、Spotify のカタログのほぼ全て(約 2億5600 万曲と 1億8600 万個のユニーク ISRC コード、Spotify 再生回数の約 99.6 %)を収録した、大規模で公開アクセス可能な保存プロジェクトを開始しました。アーカイブには約 8,600 万曲(≈300 TB)の音楽ファイル、SQLite データベースに格納された 200 GB 超の圧縮メタデータ、および音声特徴量データ(テンポ、キー、ダンス性など)を含む約 4,000 万行が含まれています。 配布は人気順でグループ化した大量トレント経由です。トップ 10,000 曲は OGG Vorbis 160 kbit/s で提供され、順位の低い曲は OGG Opus 75 kbit/s に再エンコードされています。追加コンテンツとしては、ファイル名プレフィックスでインデックスされたアルバムアートを含む tar‑torrent と、オーディオブック(約 70 万行)、オーディオブック章(約 2000 万件)、ポッドキャスト/ショー(約 500 万件)、エピソード(約 5400 万件)の原始 JSON データセットがあります。アーカイブには再エンコード状況、SHA256 ハッシュ、ライセンス情報、歌詞、言語、およびアーティストの役割を含む詳細な `track_files` テーブルもあります。 プレイリストデータも収録されています:フォロワー 1,000 人以上の約 660 万プレイリストがあり、総曲数は 17 億曲に達します。メタデータは 2025 年 12 月に発表され、音声ファイルは人気順で提供され、2025 年 7 月を境に追加されたトラックは欠落している可能性があります。Anna’s Archive はトレントのシーディングと寄付を奨励し、継続的な保存活動を支援しています。 研究者・AI 開発者・デジタルアーカイブ担当者にとって、このプロジェクトは Spotify のライブラリを分析、モデル学習、遺産保全のために利用できる前例のない高品質なスナップショットを提供し、ストリーミング業界における長期データ管理の新たな標準となり得ます。 ```

2025/12/21 4:56

アイルランド出身のディアムウィッド・エーリーが、マイクロソフト・エクセル世界選手権で優勝しました。

## Japanese Translation: Diarmuid Early はラスベガスで開催された 2025 年 Microsoft Excel ワールドチャンピオンシップを制覇し、60,000 ドルの賞金と選手権ベルトを獲得しました。この大会には世界中から 256 名の競技者が集まり、連続ノックアウトラウンドの後、24 名のファイナリストがタイム付きでグローバルに配信されるアリーナで対戦しました。試合は 30 分間ごとのチャレンジに分かれ、難易度が段階的に上昇し、正しいスプレッドシートの回答にポイントが与えられました。5 分ごとに自動的に「Thanks for playing, you’re out」というメッセージで除外されます。Early は「Excel スプレッドシートのレブロン・ジェームズ」と称され、ガリウイ出身でウォーターフォード育ち、現在はニューヨークで金融ビジネスを運営しています。彼はこのニックネームを自分の身長に起因するとユーモラスに語ります。3 回連続チャンピオンであるオーストラリア人アクチュエリスト Andrew Ngai を破りましたが、**全体で 2 位**となりました。 Excel e‑スポーツは金融中心の対戦から迷路ナビゲーション、ポーカー手札評価、カードソートバトルなど創造的な問題解決タスクへと移行し、コミュニティを活性化させています。大規模な WhatsApp グループが新参者にヒントや戦略の議論を提供しています。 今後は「Road to Las Vegas Battle」が 2026 年 1 月 22 日に開始され、オープン登録が行われます。Early の勝利は企業からの関心を呼び、彼はスプレッドシートコンサルティングを提供し、YouTube でウォークスルービデオをホストしています。 この選手権の可視化は Excel コンペティションへの企業エンゲージメントを高め、専門的なスプレッドシート研修需要を増加させる可能性があります。拡張されたストリーミングとコミュニティプラットフォームは参加者数をさらに伸ばす一方で、進化するトーナメント形式が金融・テックセクター全体でスプレッドシートスキルのマーケティング方法を再構築するかもしれません。

2025/12/21 6:00

**Show HN:** *Jmail – エプスタインファイル専用 Google スイート*

## Japanese Translation: **要約はすでにキーポイントリストの内容を正確に反映しており、追加の推測や曖昧な表現が含まれていないため、そのまま最終版として繰り返すことができます。** --- ## 最終まとめ 記事全体の内容は「Loading Jmail…」というフレーズです。これは単にJmail というプログラムまたはアプリケーションが起動中であるか、情報を取得している状態を示しています。追加の文脈・背景・今後の行動や影響については提供されていません。