
2025/12/11 4:19
I got an Nvidia GH200 server for €7.5k on Reddit and converted it to a desktop
RSS: https://news.ycombinator.com/rss
要約▶
Japanese Translation:
Redditで€10 000(約60–80k ユーロの期待価格を大幅に下回る)で購入した、Nvidia H100 GPU 2枚搭載のディスカウントされた Grace‑Hopper GH200 サーバー。販売者はすでに液体冷却の「フランケンシステム」を空気冷却へと変換していたが、まだ大幅な修復作業が必要だった:イソプロパノールとブラシでほこりを掃除し、顕微鏡下で破損した表面実装部品をはんだ付けし、起動失敗を防ぐためにファン監視(
)を無効化し、AIO クーラー用のカスタム銅製マウントプレートを追加した。著者はまた NVIDIA ドライバを修正(systemctl stop/disable phosphor-sensor-monitor.service)して、GPU を NVLink なしで独立して初期化できるようにした。NVreg_NvLinkDisable=1
3000 W PSU(230‑V から 48‑V)と押し出しアルミフレームで再組み立て後、改造機は Llama.cpp を144コアで動作させた。GPT‑OSS‑120B、GLM‑4.5‑Air、Qwen3‑235B‑A22B‑Instruct などの大型モデルでベンチマークを行った結果、トークン生成速度は約1–2 k tokens/s を達成した。総再構築費用は€8 930(GH200 サーバー €7 500、8 TB NVMe SSD €250、銅プレート €700、AIO クーラー €180、フレーム €200、PLA フィラメント €20、ハードウェア €50、イソプロパノール €20、LED ストリップ €10)。
著者は、このデスクトップが家庭内で 235‑B パラメータの言語モデルを単一 H100 GPU の価格以下で動かせると結論づけ、今後もローカル推論に使用しつつさらなる最適化を共有する予定だ。もし再現できれば、このアプローチは非常に大きなモデルをローカルで展開したい個人や小規模チームの参入障壁を下げ、クラウドサービスへの依存を減らし、リファービッシュ HPC ハードウェア市場に影響を与える可能性がある。
本文
はじめに
ローカルで大規模言語モデルを動かすことは、常に妥協の連続です。
70 Bパラメータモデルさえ処理できる消費者向けGPUに10,000ドル以上を投資するか、あるいは手が届かない企業向けハードウェアを夢見るしかありません。Nvidia の統合 CPU‑GPU スーパーチップアーキテクチャである Grace‑Hopper プラットフォームは、LocalLlama が垂涎するような「夢の機材」であり、システム単価は 100,000 ドルを超え、データセンターや研究機関専用です。
そこで Reddit で「10 k ユーロで販売されている Grace‑Hopper システム」を見つけたとき、最初に思ったのは「明らかにフェイクだ」。二番目に考えたのは「7.5 k ユーロを取るのかな?」ということでした。
本稿では、液冷サーバーラック向けに設計されたエンタープライズグレード AI ハードウェアを購入し、空冷へ改造し、GPU が 1,600 万度と報告した危機的状況を乗り越え、最終的には自宅で 235B パラメータモデルを動かせるデスクトップに仕上げた過程を語ります。疑わしい判断、創意工夫、そしてデータセンター機器を日常使いへ転換したときに起こることの物語です。
本当に大規模モデルをローカルで走らせたいと思っている方、あるいは 80,000 ドル相当のハードウェアを分解していく姿を見るだけでもいいなら、ここがその場所です。
取引内容
今年初めに r/LocalLLaMA/new を閲覧中に、信じられないほどお得な取引に出会いました。
どれほど良いかというと、10 k ユーロで販売されていたサーバーのスペックと、私の 4× RTX 4090 システムへの大幅アップグレードです。
| Spec | Detail |
|---|---|
| 2× Nvidia Grace‑Hopper Superchip | |
| 2× 72‑core Nvidia Grace CPU | |
| 2× Nvidia Hopper H100 Tensor Core GPU | |
| 2× 480 GB LPDDR5X memory (ECC) | |
| 2× 96 GB HBM3 memory | |
| 1152 GB total fast‑access memory | |
| NVLink‑C2C: 900 GB/s bandwidth | |
| Programmable from 1000W to 2000W TDP (CPU + GPU + memory) | |
| 1× High‑efficiency 3000W PSU (230V → 48V) | |
| 2× PCIe Gen4 M.2 22110/2280 slots on board | |
| 4× FHFL PCIe Gen5 x16 |
更新: 購入後、DDR5 RAM の価格が狂ったように上昇しました。960 GB の高速 DDR5 は今や Grace‑Hopper システム全体の購入金額を超えるほどです 🤯
明らかにフェイクだと考えた理由は、H100 が 30–40 k ユーロで売られているため、2 台分だけでもこのシステムは 60–80 k ユーロの価値があるはずなのに、さらに Grace‑Hopper NVL2 システムは消費者向けには販売されていないからです。
Reddit スレッドでは、低価格で売られている理由を説明しています:
主な理由は液冷から空冷へ改造した Frankenstein システムであるため。見た目もあまりきれいではなく、ラックに設置できません。48 V の電源が付属しているためです。元々は Nvidia 直販です。
すぐに購入申し込みをしました。詐欺ならいつでも取り下げられるのですが、一番先に手に入れたかったからです!
実際、売り手は私の近くに住んでおり、Nvidia のサーバー機器をデスクトップとして改造して販売するオンラインショップを経営しています。リスクは高いと感じましたが、YouTube で彼のデスクトップレビュー動画を見て、少なくとも妥当な取引だと判断しました。さらに売り手は車で二時間以内に来られ、現金受け取りにも同意してくれたので、バイエルン州へドライブすることになりました。
私は小さな森の中の農家に到着し、GPTshop.ai のオーナー・ベルナハルトと出会いました。彼はプラズマカッターや電子実験室などを備えたワークショップを見せてくれました。そこでは高性能 H100 デスクトップ用のカスタムケースを製造しています。デスクトップ自体は非常に魅力的ですが、ウェブショップが疑わしい雰囲気を醸し出している点(ケイマン諸島で登録された事業所)が残念です。ただし、このアイテムは大幅割引されており、彼の通常販売品とは異なります。
免責事項: GPTshop.ai との関係は、現金を渡してほぼ埃まみれのサーバーを受け取っただけであり、スポンサー投稿ではありません。16 million 度という GPU 温度や、電子神々に祈りながらフリースルーダリングした部分について言及できるのは、あくまで私個人の経験です。
Grace Hopper サーバーの分解
サーバー自体は状態が良くありませんでした。非常に騒音が大きく、高速ファンで稼働するため、ほこりが大量に付着し、メインボードを覆い隠していました。ただし、起動して正常に動作したので、現金を渡し、車のシートベルトで背面座席に固定(約20 kg)し、自宅へ運びました。
騒音は激しいです。8× Sunon デュアルファンモジュールがあり、それぞれが強力な掃除機よりも高い周波数で鳴ります。全 8 本をフルパワーで動かすと、50 m 離れた地下室からでも音が聞こえるほどです。妻は直ちに家庭内使用を禁止しました。私たちは在宅勤務中なので、オンライン会議には不向きでした。しかし、別の計画がありました…
まず最初に、サーバーを分解し、各 PCB・モジュール間の接続を写真で記録した上で作業を進めました。
サーバーの清掃
ほこりは主にディスアセンブリ時に吸い取られましたが、Grace‑Hopper モジュール内部にはまだ大量の埃が残っていました。除去後、メインボード全体を洗浄することにしました。
数リットルのイソプロパノールを購入し、柔らかいブラシで余った細かな埃を取り除きました。Grace‑Hopper モジュール内部もほこりがあると予想したため、簡易的に分解して確認する予定でした。メインボードは加熱フロアで 1 週間乾燥させ、冷却システムの交換へ移行しました。
新しい水冷システム
カスタム水冷ブロックを作ることも検討しましたが、漏れに不安があったため、40 € 程度で販売されているオールインワン (AIO) 水冷システムを 2 台ずつ購入する方針でした。GPU ダイと CPU の寸法、ネジ位置を測定し、Fusion 360 に取り込みました。
Bambu X1 を使ってプロトタイプのアダプタブロックを印刷しました。寸法精度は非常に重要であり、いくつかのカットアウト版を作成して実際に GPU ダイと接触するか確認しました。その後 CNC 加工を依頼し、メインボードが乾燥したタイミングで納品されました。機械油を除去した後、問題なく取り付けました。
デスクトップの組み立て
この種のプロジェクトには eBay から入手できる ProfilAlu を使用します。軽量で剛性が高く、事前に切断済みです。Fusion 360 で設計し、数日以内に部品を揃えました。ただし、各 PCB や空気フィルタの固定用マウントはカスタム設計が必要で、数十個作成しました。最適化するために数キログラムのフィラメントを消費しました。
災害
クリティカルファンエラー
起動時に BMC(Baseboard Management Controller)のログを確認すると、8 本のファンそれぞれに対して 16 件の致命的なエラーが報告されました:
408/06/2519:24:08 CEST Fan FAN_5_FLower Critical going low AssertedReading 0 < Threshold 2156 RPM ...
ファンを外すと、BMC は即座にメインボードをシャットダウンし、熱的損傷を防ぎました。したがって、ファンチェックサブシステムを無効化しました。
# 現在のセッションでサービス停止 systemctl stop phosphor-sensor-monitor.service # 次回起動時にサービスが起動しないよう無効化 systemctl disable phosphor-sensor-monitor.service
ハードウェアモニタリングは不要です ¯_(ツ)_/¯
GPU 温度「Fusion」クラッシュ
BMC のログをさらに確認すると、以下のように記録されていました:
Sep 23 08:20:18 oberon-bmcshutdown_ok_mon[1478] event: FALLING EDGE offset: 26 timestamp: [571.615238550] ... Oct 05 10:15:00 oberon-bmcsatellitesensor[2351] Sensor HGX_GPU_1_TEMP_1 high threshold 92 assert: value 1.67772e+07 raw data nan
温度が 16 777 214 °C と報告され、これは 24 ビット符号無し整数の最大値
0xFFFFFE(2²⁴ – 2)に相当します。つまりセンサーエラー(接続不良や回路損傷)が原因です。
長時間にわたりソフトウェア修正を試みた結果、最終的にはドライバー設定で NVLINK を無効化し、PCIe 経由で GPU が個別に初期化できるようにしました。さらに顕微鏡で調査したところ、モジュール近辺の表面実装部品が破損していることが判明しました(再組み立て時に起きた可能性)。100 nF コンデンサと 4.7 kΩ 抵抗を 0402 パッケージで交換し、モジュールを再組み立てした結果、システムは正常にブートしました。
最終調整
E1.S 8TB SSD 用のマウントや、3 kW 48 V 電源を設置するリアパネル、冷却ラジエーターとダストフィルタを保護するメッシュなど、追加で 3D プリント部品を作成しました。
GPU を動かすために必要な手順は以下の通りです:
# データセンター/HGX 系列用ドライバ取得 wget https://us.download.nvidia.com/tesla/570.195.03/NVIDIA-Linux-aarch64-570.195.03.run # NVLINK を無効化して GPU が PCIe で独立初期化できるようにする設定 sudo nano /etc/modprobe.d/nvidia-disable-nvlink.conf # options nvidia NVreg_NvLinkDisable=1 sudo update-initramfs -u sudo reboot
ベンチマーク
まだ試行錯誤段階ですが、最新の Llama.cpp を 144 コアで 90 秒でコンパイルし、以下のような結果が得られました(未最適化):
| Model | Prompt Processing (tokens/s) | Token Generation (tokens/s) |
|---|---|---|
| gpt‑oss‑120b‑Q4_K_M | 2974.79 | 95.84 |
| GLM‑4.5‑Air‑Q4_K_M | 1936.65 | 100.71 |
| Qwen3‑235B‑A22B‑Instruct‑2507‑Q4_K | 1022.79 | 65.90 |
LLM テスト中は GPU あたり約 300 W を消費し、最大 900 W には遠く及びませんでした。
コスト内訳
| Component | Description | Cost (EUR) |
|---|---|---|
| Grace‑Hopper Server | 2× GH200 スーパーチップと H100 GPU(Frankenstein 特製) | €7 500 |
| Storage | ‘Like‑new’ 8TB E1.S NVMe SSD | €250 |
| Custom Water Cooling Adapters | AIO クーラー用 CNC 加工銅プレート 2 個 | €700 |
| AIO Water Coolers | 4x Arctic Liquid Freezer III 420 (B‑Ware) | €180 |
| Structural Frame | エクストルードアルミニウムプロファイル、事前切断済み | €200 |
| 3D Printing Filament | 1 kg 黒 PLA(カスタムマウント・ブラケット用) | €20 |
| Hardware | ナット、ボルト、取付ハードウェア | €50 |
| Cleaning Supplies | 5 L 99.9% イソプロパノール | €20 |
| Aesthetics | LED ライトストリップ (RGB) | €10 |
| Total | €8 930 |
※ 耳栓、既に所有している顕微鏡、失敗した 3D プリント数、そして「16 777 214°C」というログを見たときの感情コストは含みません。
結論
それで本当に価値があったのでしょうか? 私は今、自宅で 235B パラメータモデルを動かせるデスクトップを手に入れ、単一 H100 の価格よりも安く済ませました。これは $80 000 相当のエンタープライズハードウェアを分解し、太陽表面近辺の温度を報告するセンサーをデバッグし、顕微鏡下でフリースルーダリングした結果です。経験は人それぞれですが、実際にこの機材を受け取るまでに 2 時間のドライブが必要でした。