SCION協会向けに 25 Gbps のワークステーションを構築する

2026/01/13 1:20

SCION協会向けに 25 Gbps のワークステーションを構築する

RSS: https://news.ycombinator.com/rss

要約

Japanese Translation:

改善された概要

本書は、商用ハードウェアを使用してラインレートパケット処理に達する高性能SCION境界ルーター作業ステーションの構築について詳述しています。システムはASUS Pro WS W790E‑SAGE SEマザーボード、Intel Xeon W5‑2455X(12コア、3.2 GHz)と64 PCIe Gen5レーン、およびMellanox NVIDIA BlueField‑2 DPUs(デュアルポート25 G SFP28 NIC、各8 Gbit/s、合計24 Gbit/s)を中心に構築されています。AF_XDP(Linux XDP/Zerocopy)がカーネルネットワーキングスタックをバイパスするために使用され、MTU 1500で約24.6 Gbit/s(約2 Mpps)のスループットが達成されました。ファームウェアはDOCAバンドル 24.46.3048に従ってアップグレードされ、NICはDPUモードからNICモードへ切り替えられ、遅延と複雑さを低減しました。総ハードウェア費用はCHF 3,741.34(約$4,700 USD)でした。

組み立てではPCIeスロットの配置に細心の注意が必要であり、GPUを誤ったスロットに差し込むと「ノーシグナル」になる問題や、CPUが無効化されたM.2 SSDへの対応、NIC温度を約60 °C以下に保つための正確なファン配置が求められました。ASUS AST2600のBMCパスワードバグはipmitoolによる回復が必要でした。

作業ステーションはオフィス環境で展開され、銀行インフラ制限によりTailscaleトンネルを使用してアウト・オブ・バンドBMCアクセスを行います。この構築例は、SCION境界ルーティングが入手可能なハードウェアでほぼラインレートの性能を達成できることを示し、実際のファームウェアと設定に関する教訓も明らかにしています。

本文

SCION 25 Gbit/s ワークステーション

このワークステーションはLGA4677ベースのシステムで、12コアIntel Xeon CPUを搭載し、64チャンネルのPCIe Gen5レーンを3枚のMellanox NVIDIA BlueField‑2 Dual‑25GスマートNICに供給しています。最終的にはSCION Associationが提供する新しい25 Gbit/sテストベンチを実現します。

  • 目的 – SCION OSS向けAF_XDPアンダーレイの開発とテスト。データプレーン性能は大幅に改善されたものの、さらなる作業が必要です。
  • スケジュール – 数週間にわたるプロジェクト。総費用:CHF 3 741.34(約USD 4 700)(詳細部品リスト以下)。

背景

SCION(Scalability, Control, and Isolation On Next‑Generation Networks)はIETFのドラフト段階にあるBGP代替プロトコルで、BGPの根本的欠点とセキュリティ脆弱性を解決することを目指しています。最終的にはBGPを置き換える可能性もありますが、現実的には共存が想定されます。SCION上で運用すべき重要インフラは以下の条件を満たします。

  • パス認証
  • 明示的パス制御(例:ジオフェンシング)
  • 一貫したレイテンシ特性
  • 決定論的フェイルオーバー

瑞士国立銀行は現在、SCIONベースのSSFNを用いてバンクインフラを稼働させており、Anapaya Systems AG の商用100 Gbit/s境界ルータソリューションに依存しています。オープンソース実装(github.com/scionproto/scion)は多くのデータプレーン性能向上を経験しましたが、それでも遅れがあります。

SCION OSS上でビデオ通話などの高帯域幅ユースケースを可能にするには、より高速なAF_XDP境界ルータアンダーレイが必要です。NLnet Foundation の資金提供によりこの取り組みが支援されています。


境界ルータ性能

  • 現在のSCION OSS境界ルータ:~400k–500kパケット/秒(1500バイトMTUで約5–6 Gbit/s)。
  • これは現代インターネットトラフィックが要求する数百テラビット/秒に比べ極めて低いです。
  • 「ストリーム」とは、スレッド間で並列化できずパケット順序を不可逆的に乱すことのない、ソースからデスティネーションへの単一フローです。

Linux ネットワーキングスタック

SCION OSS境界ルータはユーザ空間で動作し、Linuxネットワーキングスタックのみを利用しています。パケットの流れは飛行機の旅に例えると分かりやすいです。

  1. 空港(NIC受信キュー)
  2. チェックイン&手荷物(バッファ割当)
  3. セキュリティ検査(パケットフィルタリング)
  4. パスポート管理(経路決定・ポリシーチェック)
  5. ゲート待ち行列(スケジューリング)
  6. 搭乗(ユーザ空間へコピー)
  7. 座席割り当て(ユーザ空間バッファ)

高スループットを実現するには、このスタックを迂回し、AF_XDP のようなカーネルバイパス経路を利用する必要があります。


カーネルバイパスオプション

オプション説明
DPDKNIC をカーネルスタックから除外するユーザ空間フレームワーク。NIC の排他制御が必要。
AF_XDPLinux ネイティブ機構で、NIC ドライバとユーザ空間の共有メモリリングを通じて高性能パケット I/O を実現。
VPPDPDK または AF_XDP をバックエンドに持つ高速ベクトル化ユーザ空間パケットプロセッサ。

DPDK はピーク性能が高いものの、AF_XDP の方が使いやすさ・保守性・運用単純性で優れており、Go ベースの境界ルータとの相性も良いため採用しました。


AF_XDP 設定手順

  1. UMEM – 大きなメモリ領域を mmap(可能ならハズページ)。
  2. リング – fill, completion, TX, RX の各リングを初期化。
  3. ソケットバインド – AF_XDP ソケットを NIC キューに結び付ける(XDP_ZEROCOPY モードが利用可能なら設定)。
  4. eBPF/XDP プログラム – 小規模 eBPF プログラムをロードし、パケットを mmapped メモリフレームへリダイレクト。

これによりネットワークスタックを完全にバイパスし、原始的なパケットフレームを境界ルータへ低オーバーヘッドで直接渡せます。


実務上の課題

  • VM プロバイダは XDP/AF_XDP(特にゼロコピー)へのアクセス権限を持たないことが多く、ベアメタル環境が必須。
  • コンシューマー向けシステムで AF_XDP の ZEROCOPY モードをサポートするものは少なく、専用ハードウェアが必要。

構築計画

目標 – 予算と低騒音要件の範囲内で、単一スレッドで25 Gbit/s を達成。

3つの選択肢を検討:

選択肢長所短所
中古ラックサーバ(例:LackRack)低価格・入手容易騒音が大きい
中古タワーサーバ静音性高く、コスト低めNIC と PCIe レーンが限られる
自作設定を完全に制御可能高価で労力必要

NIC の可用性と予算を評価した結果、自作システムを選択しました。

NIC 選択

  • Intel Ethernet 800 系列(E810ファミリー)
  • NVIDIA/Mellanox ConnectX‑5/6/7
  • Broadcom NetXtreme‑E
  • FastLinQ

最終決定: Mellanox NVIDIA BlueField‑2 DPUs – デュアル25 Gbit/sポート、1枚あたり €115。

マザーボード

候補:

  1. Gigabyte MS03‑CE0
  2. ASUS Pro WS W790E‑SAGE SE

両者ともに 7 スロットの完全16× PCIe Gen5 とリモート管理機能を備えている。ASUS ボードは入手可能だったため採用。

CPU

  • 推奨:Intel Xeon W‑3400 系列(≈CHF 1 600) – 高価
  • 実際に選択:Intel Xeon W5‑2455X – 12コア、3.2 GHz ベース、64× PCIe Gen5 レーン、CHF 1 105。

CPU クーラー

  • 選択肢:Arctic Freezer 4U‑M、Noctua NH‑U14S DX‑4677
  • 選択:Noctua NH‑U14S(静音かつ効果的)

メモリ

  • Corsair DDR5 RDIMM キット – 64 GB (4×16 GB)、5600 MT/s、ECC。CHF 536。

ストレージ

  • Samsung 990 Pro – 1 TB M.2 2280(ヒートシンク付き)。CHF 101。

電源ユニット

  • Corsair RM850e – 850 W。CHF 113。

ケース

  • Phanteks Enthoo Pro II (SSI‑EEB)。CHF 170。

ファン

  • Noctua NF‑A12x25 G2 PWM(静圧)×2
  • Noctua NF‑A14 PWM(全体空気流)×6

部品リスト(合計: CHF 3 741.34)

コンポーネント数量小売業者価格
ASUS Pro WS W790E‑SAGE SE1digitec.chCHF 962.90
Intel Xeon W5‑2455X1galaxus.chCHF 1106.00
Corsair DDR5 RDIMM 64 GB (4×16 GB, 5600 MT/s, ECC)1galaxus.chCHF 536.00
Corsair RM850e (850 W)1digitec.chCHF 113.00
Samsung 990 Pro w/ Heatsink (1 TB, M.2 2280)1digitec.chCHF 101.00
Noctua NH‑U14S DX-4677 CPU cooler1digitec.chCHF 132.00
Phanteks Enthoo Pro II Server Edition TG (SSI‑EEB)1galaxus.ch~CHF 170.00
Noctua NF-A14 PWM (140 mm)6digitec.chCHF 149.40
Noctua NF-A12x25 G2 PWM Sx2-PP (120 mm, 2‑pack)1(2ファン)digitec.chCHF 64.90
Noctua NF-A12x25 G2 PWM (120 mm)1digitec.chCHF 34.90
Mellanox/NVIDIA BlueField‑2 BF2H532C デュアルポート 25G(PCIe 4.0 x8)3piospartslap.deCHF 318.09
25G SFP28 パッシブ DAC ケーブル 0.5 m3ricardo.chCHF 51.15 + CHF 2.00 配送料

要約

自作 SCION ワークステーションは、単一スレッドで 25 Gbit/s の AF_XDP ベース境界ルータを実現し、ラインレートでほぼパケットロスゼロかつオフィス環境に適した低騒音性能を提供します。構築は性能・保守性・コストのバランスが取れており、完全な部品リストを示すことで再現性も保証しています。

同じ日のほかのニュース

一覧に戻る →

2026/01/13 4:27

了解しました!内容は明確で簡潔に保ちます。余分な改行や不必要な記号は入れず、リストがある場合は読みやすいようにきちんとインデントします。他にご要望がございましたら、お気軽にお知らせくださいね!

## Japanese Translation: **改訂された概要** CoworkはClaude Maxをベースにしたリサーチプレビュー・ツールで、現在はmacOSアプリを通じてMaxサブスクライバー向けに利用可能です。ユーザーが自分のコンピュータ上の特定フォルダへのClaudeのアクセス権を付与すると、そのフォルダ内のファイルを読み取り・編集・作成できるようになります。これにより、ダウンロードの整理、スクリーンショットからスプレッドシートを生成すること、散在したメモからレポートをドラフトするなどのタスクが便利に行えます。 標準的なチャットとは異なり、CoworkはAIにより大きな主体性を与えます。AIはタスクを計画し、実行し、進捗状況を提供します。このツールはClaude Codeと基盤を共有しており、非コーディングの文脈でもコード風の対話が可能です。ユーザーは既存のコネクター(例:ドキュメントやプレゼンテーション)をリンクしたり、Chromeとのペアリングでウェブ閲覧を行ったりして機能を拡張できます。AIは複数タスクをキューに入れ、並列実行することで前後のチャットを減らします。 制御権はユーザーに残ります:Claudeが見るフォルダとコネクターを選択し、大きな操作を行う前にプロンプトが表示されます。ただし、誤った指示でファイルが削除されたり、プロンプトインジェクションが発生するリスクもあるため、安全対策は継続的に開発中です。 このプレビューはフィードバックを集めることを目的としており、将来のリリースではデバイス間同期、Windowsサポート、強化された安全機能、および拡張されたコネクターオプションが追加される可能性があります。Coworkは個人向けにファイル整理を効率化し、手動監視を保ちながらファイルベースのワークフローを自動化する制御可能なAIアシスタントとして設計されています。

2026/01/13 1:04

**TimeCapsuleLLM:** 1800年〜1875年のデータのみで訓練された大規模言語モデル (Note: The length is preserved while using natural, polite Japanese.)

## Japanese Translation: ``` ## Summary TimeCapsule LLM プロジェクトは、歴史的な英語データのみを使用して言語モデルをゼロから構築し、現代のバイアス(「Selective Temporal Training」)を排除します。 - **Model evolution** - *v0* (16 M パラメータ、nanoGPT ベース) は約187 MB の1800年代テキストで訓練され、1800年代風の言語を生成しましたが、一貫性のない文になりました。 - *v0.5* (123 M パラメータ、引き続き nanoGPT) はコーパスを約435 MB に拡張し、文法・句読点を改善しましたが、高い幻覚と OCR ノイズに悩まされました。 - *v1* (700 M パラメータ、Phi 1.5 ベース) は約6.25 GB のデータで訓練され、歴史的事件や人物を正確に思い出せるようになりました。 - *v2mini‑eval1* (300 M パラメータ、90 GB London コーパス全体の15 GBサンプル) はわずか10 K ステップで訓練され、トークナイズ問題により「Who is Charles Dickens?」のような文字化けした出力が生成されました。 - *v2mini‑eval2* (v2mini‑eval1 と同じサイズ・データ) はチャールズ・ダーウィンについて極めて不連続なテキストを生成しました。 - **Dataset** 完全版 v2 データセットは1800–1875 年のロンドン テキストで 90 GB を含み、136,344 ドキュメントから構成されています。15 GB のサンプルは Hugging Face(https://huggingface.co/datasets/haykgrigorian/TimeCapsuleLLM-London-1800-1875-v2-15GB)で公開されています。 - **Training setup** *v0/v0.5* は GeForce RTX 4060 GPU、i5‑13400F CPU、および 16 GB RAM を使用しました。 *v1* と *v2mini‑eval1* はレンタル NVIDIA A100 SXM GPU 上で訓練されました。 - **Tokenization & evaluation** 時代固有のスペリングと語彙に対応するカスタムトークナイザー(vocab.json & merges.txt)を構築しました。出力は言語的正確さ、幻覚率、およびトークナイズ品質で評価され、バイアス統計は別途 v2 バイアスレポートに記載されています。 - **Future work** 今後の計画として、完全版 90 GB v2 データセットへの拡張、トークナイザーパイプラインの改良、およびより深いバイアス分析を実施します。 - **Impact** このプロジェクトは、歴史家・教育者・AI‑ethics 開発者が時代に即した言語モデルを必要とする際に有益であり、現代バイアスを減らすための時間的選択訓練(temporal selective training)の具体例として NLP コミュニティにも貢献します。 ```

2026/01/13 5:26

ファブリス・ベルラール氏のTS Zip(2024)

## 日本語訳: **概要** ts_zip は、GPU を活用したテキスト圧縮ツールであり、RWKV 169M v4 大規模言語モデル(パラメータを 8 ビットに量子化し、BF16 で評価)を使用してトークン確率を予測し、その予測に基づいて算術符号化を適用します。従来のツールよりも高い圧縮率を達成しています: - alice29.txt – **1.142 bpb**(21,713 B) - book1 – **1.431 bpb**(137,477 B) - enwik8 – **1.106 bpb**(13,825,741 B) - enwik9 – **1.084 bpb**(135,443,237 B) - linux‑1.2.13.tar – **1.021 bpb**(1,196,859 B)。 RTX 4090 上では、ツールは約 1 MB/s の速度で圧縮し、同程度の速度で解凍します。システムに少なくとも **4 GB の RAM** があることが前提です。ts_zip は実験的なものであり、バージョン間の後方互換性は保証されません。また、その性能評価は GPU/CPU またはスレッド数に依存せず、決定論的に行われます。この手法はプレーンテキストファイルで最も効果を発揮し、バイナリデータではエントロピーの削減がほとんど得られません。主に英語で訓練されていますが、他言語やソースコードにも比較的適切に対応します。 ダウンロードリンク: - Linux tarball: `ts_zip‑2024‑03‑02.tar.gz` - Windows ZIP: `ts_zip‑2024‑03‑02-win64.zip` 将来のリリースでは、圧縮率をさらに向上させ、言語サポートを拡大し、可能ならファイルタイプの取り扱いを追加しつつ、ハードウェア間で評価が再現できるようにすることを目指します。GPU リソースを持つユーザー(データアーカイブ担当者や大量テキストコーパスを管理する開発者など)にとって、速度を犠牲にせず高い圧縮率を実現できる最適なツールです