
2026/05/08 12:31
AWS ノースバージニア地区におけるデータセンター障害――復旧には数時間かかると予想される
RSS: https://news.ycombinator.com/rss
要約▶
Japanese Translation:
AWS は、バージニア州のデータセンターでサーバー温度を適切に制御できず、FanDuel や Coinbase といった主要プラットフォームの大規模な障害を引き起こした過熱によるハードウェアの問題により、US-East-1 リージョンで深刻な運用混乱に見舞われました。この障害の原因は、Virginia に所在する単一のデータセンターがサーバー温度を効果的に管理できなかったこととして特定されました。その結果、仮想サーバーの機能低下や取引サービスの障害が発生しました。典型的な短時間で解決される事案とは異なり、エンジニアが修理のバックログを処理し、故障したコンポーネントの交換と追加冷却容量の設置を行った上で、すべての影響を受けたシステムの完全な復旧が完了するため、本件にはより長い修理期間が必要です。その結果、ユーザーは FanDuel での賭け金のカッシュアウトなど、重大なダウンタイムを経験しました。AWS が数百万企業のサービスを提供し、グローバルクラウドインフラストラクチャ市場の約半分を支えていることを考えると、この事象は AWS の信頼性の重要性を浮き彫りにしています。現時点では初期対応策が実施されていますが、影響を受けたすべてのシステムの完全な復旧には、エンジニアによる修理のバックログ処理に伴い、さらに数時間かかると予測されています。
本文
AWS の運用障害により、Coinbase や FanDuel などの主要プラットフォームに影響が及んだ件
世界有数のクラウドコンピューティングサービスプロバイダーであるアマゾン・ウェブ・サービス(AWS)は、木曜日より運用上の問題が発生し、Coinbase や FanDuel など複数のプラットフォームでの取引に支障をきたしました。AWS 側によれば、本障害の原因は、メインである米国東部 1 地域(バージニア州北部に所在するデータセンター)内の冷却システムの過熱によるものです。当初、影響範囲は同地域の特定の可用性ゾーン(Availability Zone)に限定されていました。
事象のタイムラインと最新情報
- 木曜日午後 8 時 25 分(東部夏時間): AWS ヘルスダッシュボードにて、「インスタンス障害について調査中」とする初の警報が投稿されました。同日午後 9 時には、スポーツ賭博アプリファンデュエル(FanDuel)は X を 통해、ユーザーのアクセスを制限している技術的な不具合についてチームが認識している旨を発表しました。
- 金曜日午後 3 時 29 分(東部夏時間): AWS は最新の更新情報において、完全な復旧には数時間を要すると予測されるとともに、「対応速度は当初の想定よりも遅れています」と述べました。
- 金曜日午前 9 時 51 分(東部夏時間): AWS は、影響を受けたゾーン内で残存するハードウェアの復旧を進めるため、追加の冷却システム容量をオンライン化する活動が活発に行われていること报了告しました。また、仮想サーバー機能を担う EC2 インスタンスの不具合解消についても、着実な対応が進んでいることを確認しました。
その後、ファンデュエルは最初の警報から 2 時間後に追加情報を発信し、本問題が広範な AWS の障害に起因することを示唆しつつ、賭博家からの不満(引き出し不能による賭け金の損失など)への配慮を示しました。金曜日には、Coinbase も X を 통해、複数の AWS ゾーンで障害が発生し取引サービスの一時的な停止を引き起こしたことについて説明しましたが、主要な問題は既に完全に解消されたことを伝えました。
業界への影響 AWS はクラウドインフラストラクチャ技術市場の約 3 分を取り、数百万の企業にサービスを提供しています。AWS の今回の技術問題に加え、最近のテクノロジー界隈では、OpenAI に関する裁判の進展、ポール・テッド・ジョーンズ氏が AI 規制に関する見解を示したこと、CoreWeave が収益を倍増させたこと、Datadog が好決算を受け株価が上昇したなど、多彩な話題が報じられています。