**クラウドフレアのGen 13サーバー:** コア数とキャッシュ容量を入れ替えて、パフォーマンスを2倍にしています。

2026/03/24 7:06

**クラウドフレアのGen 13サーバー:** コア数とキャッシュ容量を入れ替えて、パフォーマンスを2倍にしています。

RSS: https://news.ycombinator.com/rss

要約

Japanese Translation:

Cloudflare は、AMD EPYC 5th‑Gen「Turin」CPU と Rust ベースのリクエストハンドラ FL2 を搭載した新しい Gen 13 エッジサーバーをデプロイ完了しました。Turin はコア数が倍増(最大 192 コア、Gen 12 の 96 コアに対して)し、Zen 5 により IPC が向上、1 コアあたりの電力消費が約32%削減され、DDR5‑6400 メモリバンド幅をサポートします。チップは全コアで 384 MB の L3 キャッシュしか共有せず、1 コアあたり約 2 MB(Gen 12 の 3D V‑Cache を搭載した場合は 12 MB/コア)です。

元の FL1 ハンドラ(NGINX/LuaJIT)は Turin 上で L3 ミス率が高く、ミスサイクルが約350回に対しヒットは約50回と遅延が増大し、スループット向上にもかかわらずレイテンシが悪化しました。プリフェッチャーの調整、ワーカースケーリング、および NUMA コアアフィニティの最適化を行っても、スループットはわずか 5 % 未満にしか改善されませんでした。FL2 の軽量メモリアクセスパターンはこのボトルネックを解消し、Turin 上で Gen 12 に比べ約 50 % 低いレイテンシ、62 % 高いスループット、および FL1 より CPU あたり 2 倍のリクエスト数を実現します。

Gen 13 が Cloudflare のグローバルエッジネットワーク全体に完全展開されたことで、同社はサーバー数を減らしつつより多くのトラフィックを処理できるようになり、SLA に縛られたレイテンシを維持したままで最大 2 倍のスループットを達成します。これにより、パフォーマンス・ペー・ワットが約 50 % 改善され、ラック単位でのスループットは約 60 % 向上します。結果として CDN とクラウド顧客双方の運用コスト削減とカーボンインパクト低減に寄与します。

本文

2026‑03‑23
読み込み時間 2 分


二年前、Cloudflare は AMD EPYC™ Genoa‑X プロセッサを搭載した第12世代のサーバーフリートを導入しました。これには大容量の3D V‑Cache が組み込まれており、当社のリクエスト処理層 FL1 と完璧に合致していました。しかし次世代ハードウェアを評価した際、大きなスループット向上を実現できる CPU はキャッシュ容量が大幅に削減されていたため、既存スタックは最適化されておらず、潜在的なスループットはレイテンシの増加で抑えられていました。

本記事では、Cloudflare のコアリクエスト処理層を Rust で書き直した FL2(FL1 の完全再実装)へ移行することで、第13世代 Gen 13 が持つ真価を発揮し、旧スタックでは不可能だったパフォーマンス向上が得られた経緯を解説します。FL2 は大容量キャッシュへの依存を排除し、コア数に応じて性能が伸びる一方で SLA を維持できます。


AMD EPYC™ Turin がもたらすメリット

FeatureGen 12 (Genoa‑X)Gen 13 – Option 1 (Turin 9755)Gen 13 – Option 2 (Turin 9845)Gen 13 – Option 3 (Turin 9965)
コア数 / スレッド96 C / 192 T512 C / 256 T516 C / 320 T519 C / 384 T
L3 キャッシュ/コア12 MB (3D V‑Cache)4 MB2 MB2 MB
IPC+ ?
電力効率コアあたり最大32 %低減
DDR5‑6400 対応

Turin は高密度のオンチップネットワーク(OPNs)を備えており、キャッシュよりもスループット優先です。192 コアは合計 384 MB の L3 を共有し、コアあたりわずか 2 MB ― Gen 12 の割り当ての六分の一に過ぎません。


パフォーマンスカウンタで問題を特定

Gen 13 の CPU 評価フェーズで AMD uProf データを収集しました:

  • L3 キャッシュミス率 が Gen 12 と比べ急増
  • メモリ取得レイテンシ がリクエスト処理を支配し、以前 L3 に残っていたデータが DRAM へ飛ぶように
  • CPU 利用率上昇とともにレイテンシペナルティも拡大、キャッシュ競合悪化
  • L3 ヒットは約50サイクル対ミス >350サイクル ― 一桁差

コアあたり 6 倍のキャッシュ削減で FL1 は Gen 13 上で頻繁にメモリアクセスを行い、レイテンシが大幅に増加しました。


トレードオフ:レイテンシ vs. スループット

MetricGen 12 (FL1)Gen 13 – Turin 9755 (FL1)Gen 13 – Turin 9845 (FL1)Gen 13 – Turin 9965 (FL1)
コア数基準値+33 %+67 %+100 %
FL スループット基準値+10 %+31 %+62 %
レイテンシ(低〜中程度 CPU)基準値+10 %+30 %+30 %
レイテンシ(高 CPU)基準値>20 %>50 %>50 % (不可)

9965 は 60 % のスループット向上を提示しましたが、50 %以上のレイテンシペナルティは受け入れられませんでした。TCO を改善しつつ顧客体験を損なわないソリューションが必要でした。


パフォーマンスチューニングで得た漸進的向上

AMD と協力してターゲット最適化実験を行いました:

ConfigurationDescriptionResult
ハードウェアチューニングプレフェッチャー & DF Probe フィルタ調整微増
ワーカー数拡張FL1 ワーカーを増やすスループット向上、リソース奪い合いも発生
CPU ピンニング & アイソレーション負荷分離の最適化限定的な成功
PQOS (Platform QoS)キャッシュ・帯域幅を細かく制御ソケットレベルで最大効果

PQOS 実験

Config割り当てスループット増加他サービスへの影響
NUMA‐aware コアアフィニティ(ソケットレベル)6/12 CCD、各32 MB L3>15 % 増加
PQOS 1各 CCD の物理コアの vCPU 2 つ中 1 つに 75 % の 32 MB L3 を割り当て<5 % 増加軽微な低下
PQOS 2同上、50 % 割り当て<5 % 増加
PQOS 3物理コアの 50 % に vCPU 2 を割り当て、L3 の 50 % を共有<5 % 増加

これらの調整でも成果は限定的でした。真のブレークスルーは FL2 にありました。


機会:FL2 はすでに進行中

当社は既に FL1 の完全再実装を推進していました。FL2 は Rust で書き直されたフルリプレイスで、Pingora と Oxy フレームワークを活用し、15 年にわたる NGINX/LuaJIT コードベースを置き換えます。その洗練されたアーキテクチャとメモリアクセスパターンは大容量 L3 キャッシュへの依存度を低減―Gen 13 に最適です。


実証:FL2 on Gen 13

Gen 13 サーバでの実運用指標が仮説を裏付けました:

MetricGen 13 Turin 9965 (FL1)Gen 13 Turin 9965 (FL2)
FL リクエスト/CPU基準値50 % 高
レイテンシ vs Gen 12基準値70 % 低
スループット vs Gen 12基準値62 % 高;全体で 100 % 高

FL2 はレイテンシペナルティを 70 % 削減し、SLAs を満たしつつ Gen 13 の CPU 利用率を高めることが可能に。キャッシュボトルネックを解消した結果、スループットはコア数に線形で伸び、Turin 9965 では 2 倍の性能向上を実現しました。


Gen 13 で得られた世代間改善

AMD EPYC™ 第5世代 Turin(9965)を Gen 13 の正式採用としました。ハードウェア検証は完了し、Gen 13 サーバはグローバル展開に向けて大量出荷中です。

FeatureGen 12Gen 13
コア数96 C / 192 T519 C / 384 T
FL スループット基準値+100 %
パフォーマンス/ワット基準値+50 %

Gen 13 のビジネスインパクト

  • 最大2×のスループット(Gen 12) ― レイテンシ SLA を維持しつつ容量を倍増
  • 50 % 以上の電力効率向上 ― データセンター拡張コストとカーボンフットプリント削減
  • 60 % のラックスループット向上 ― 次世代コンピュートをパワー予算増加なしに展開可能

Gen 13 + FL2:エッジでの実用化へ

旧 FL1 は Gen 13 でキャッシュ競合壁に直面し、スループットとレイテンシのトレードオフを余儀なくされました。代わりに FL2 を構築し、大容量 L3 キャッシュへの依存を排除した軽量メモリアクセスパターンでコア数に比例して性能が伸びるよう設計しました。AMD Turin 上で動作する FL2 は、スループットを 2 倍、電力効率を 50 % 向上させながらレイテンシ SLA を維持します。

この飛躍はハードウェアとソフトウェアの共同設計の重要性を示すものです。Gen 13 サーバは現在、Cloudflare のグローバルネットワーク全体で数百万リクエストを処理する準備が整いました。


もしグローバル規模でインフラに携わることに興味があるなら、採用中です。
Cloudflare の接続クラウドは企業ネットワークを保護し、ウェブアプリケーションを高速化し、DDoS 攻撃から守り、Zero‑Trust を実現します。

任意のデバイスから 1.1.1.1 にアクセスして、インターネットをより速く安全にする無料アプリをお試しください。ミッションやキャリアについてはウェブサイトをご覧ください。

同じ日のほかのニュース

一覧に戻る →

2026/03/27 5:53

**Deploytarot.com – デプロイメントのタロットカードリーディング** 「デプロイプロジェクトに対する洞察に満ちた指針を、個別化されたタロットカードリーディングで得ましょう。」

## 日本語訳: 記事では、ソフトウェアデリバリーを一連のタスク、リスク、およびステークホルダーの視点として可視化する比喩的な「カードデッキ」を紹介しています。各カードは、A/Bテスト、AI統合、DB移行、サーバーレス移行などの特定のタスクとアイコンおよび簡潔な説明をペアにします。リスクカードでは、「どの指標が重要かについてゼロコンセンサス」や「カードが見ている」という不確実性を列挙しています。役割カードは、CEO、CISO、CTO、清掃係、クライアント、コンサルタント、請負業者、DBA、データサイエンティスト、デザイナー、DevOpsエンジニア、エンジニアリングマネージャー、人事、インターン、ジュニア開発者、オフショア開発者、プロダクトマネージャー、プロジェクトマネージャー、QAエンジニア、受付係、営業、スクラムマスター、セキュリティエンジニア、シニアデベロッパー、SRE、ステークホルダー、テックリード、VP of Engineering など多岐にわたるステークホルダーの各役割がデプロイメント決定をどのように見ているかを示す一文の逸話を提供します。 物語は「アーケナはあなたのスプリント速度を気にしない」と強調し、代わりに「時折その終点で崖がある」という潜在的な落とし穴をハイライトすることに焦点を当てています。 デッキは各引きごとに新たにシャッフルされますが、「戻ってくると覚えている」と説明され、過去の洞察を保持する動的システムであることを示唆しています。 速度よりもリスク認識を前面に押し出すことで、このモデルは多様な役割間で明確なコミュニケーションと整合性を維持し、よりレジリエントなデリバリープロセスを育むことを奨励します。

2026/03/26 0:46

**2025年に多くの制御室がシー・フロムグリーン(海泡色)を採用した理由は?** | 要因 | なぜ重要だったか | |------|-----------------| | **エルゴノミクス研究** | その年に公開された調査では、海泡色が目の疲労を軽減し、長時間の監視作業中に集中力を向上させることが示されました。 | | **省エネルギー動向** | この色は白や黄よりも自然光を反射しやすく、24時間稼働する環境で人工照明の必要性を低減します。 | | **ブランドアイデンティティ** | いくつかのテック大手が「グリーンファースト」サステナビリティイニシアチブを開始し、その理念に合わせて制御室も再設計されました。 | | **心理的影響** | 緑は落ち着きとバランスに結びついており、オペレーターが重要なシステムを管理する際には不可欠な特性です。 | | **規制ガイドライン** | 新たな安全基準では、状態インジケータの可視性を高めるカラースキームが推奨されており、海泡色は赤警報と衝突せずにその要件を満たしました。 | まとめると、エルゴノミクス科学、省エネルギー政策、企業ブランディング、心理研究、そして更新された規制の融合が、2025年の制御室にとって実用的でストレスの少ない選択肢として海泡色を押し上げました。

## Japanese Translation: 記事は、核施設や工業サイトでよく見られる特徴的な海藻緑色を第二次世界大戦時のファーバー・ビレン(Faber Birren)の産業用カラー安全コードに遡ります。2017年夏、著者はオークリッジのX‑10グラファイト炉(「ファットマン」研究のためにロスアラモスへ輸送されたプルトニウムを生成した24フィート四方のブロック)を訪れ、壁と制御パネルでビレンが推奨するライト/ミディアムグリーンが一貫して使用されていることに注目しました。ビレン(1919–1996)は1944年に国立安全協議会によって承認されたカラーコードを開発し、1948年までに世界中で採用されました。このコードは次のような色から構成されています: - **Fire Red** – 火災防止、緊急停止、可燃液 - **Solar Yellow** – 注意、物理的危険 - **Alert Orange** – 危険機械部品 - **Safety Green** – 救急装置、出口、洗眼ステーション - **Caution Blue** – 非安全通知または故障表示 - **Light Green** – 視覚疲労を軽減する壁色 同じスキームがハンフォードのB‑レイザー制御室にも見られます:下部壁にミディアムグリーン、機械にはミディアムグレー、火災防止にファイヤーレッド、低照度エリアにベージュ、床はライトです。ビレンは、このような機能的カラー使用が明るさを制御し、事故を減らし、メンテナンス基準を向上させ、労働士気を高めると主張しました。 ドイツの「ケルン橋緑(Cologne Bridge Green)」は、橋という工業用途で開発された海藻緑色の別例です。著者はまた、古い自動車部品リストに触発されて「Parts List」というフォントをデザインし、オイル交換待合室の雰囲気を呼び起こすことを目的としています。このフォントは彼女のウェブサイトで入手可能です。彼女はこれら歴史的安全色が今日どのように適用できるかを引き続き探求し、海藻緑の使用を現代施設に拡大する可能性や、「Parts List」フォントを産業美学を捉えるデザインツールとして推進する計画です。

2026/03/24 0:17

**「DOOM Over DNS」** (ドゥーム・オーバーDNS)

## Japanese Translation: (すべての重要ポイントを統合し、根拠のない推測を除外した文書) このプロジェクトは、Cloudflare にホストされた DNS TXT レコードだけで、完全な shareware DOOM ゲームを実行する方法を示しています。PowerShell 7 スクリプトを使用して、9 MB の WAD ファイルと .NET エンジンを直接メモリにロードします—ディスクへの書き込みは発生しません。 主な詳細点: * WAD 全体は約1,964 個の TXT レコードに分割されます。各レコードは公開 DNS クエリで取得されます。 * .NET エンジン DLL も DNS からストリームで読み込み、Native AOT ビルドをフレームワーク依存型の .NET 8 アセンブリに変換する managed‑doom フォークを使用します。これにより、WAD のストリームベースロードと Win32 P/Invoke によるウィンドウ操作(GLFW なし、音声は NullSound/NullMusic スタブ)が可能です。 * インストールには PowerShell 7 が必要です (`winget install Microsoft.PowerShell`)。メインスクリプトは `Start-DoomOverDNS.ps1 -PrimaryZone 'example.com'` です。 * 新しいビルドを公開する手順: * エンジンを次でビルドします ``` dotnet publish ManagedDoom/ManagedDoom.csproj -c Release -f net8.0 -o publish-out ``` * Cloudflare の認証情報を `Set-CFCredential -ApiToken …` で設定します(トークンは「Edit zone DNS」権限が必要)。 * `Publish-DoomOverDNS.ps1` を次の引数で実行します:`-PublishDir`, `-WadPath 'DOOM1.WAD'`, `-Zones @('example.com')`。オプションとしてプレフィックス(`-WadPrefix`, `-LibsPrefix`)や DNS サーバー上書き(`-DnsServer`)を指定できます。 * Cloudflare の無料ゾーンは最大 185 個の TXT チャンクしか保持できませんが、Pro/Business/Enterprise ゾーンでは 3,400 個まで可能です。WAD 単体で約1,199 個のチャンクが必要なため、Free‑tier ユーザーは `-Zones` に複数ドメインを指定する必要があります。 * アップロードは再開に対応しています:スクリプトはハッシュを検証し、`-Resume` フラグで最後の正常チャンクから継続できます。 * `Start-DoomOverDNS.ps1` のパラメータ:`-PrimaryZone`, `-DnsServer`, `-WadName`(デフォルト `'doom1'`)、`-DoomArgs`, `-WadPrefix`, `-LibsPrefix`。 主要コンポーネントは、managed‑doom, Silk.NET, TrippyGL, id Software のオリジナル DOOM1.WAD、および Cloudflare DNS API です。このプロジェクトは、Cloudflare のグローバル DNS ネットワークとエッジキャッシュを活用し、ゲームデータを世界中に分散させるメモリのみでディスク不要な実行モデルを示しています。