GitHub の稼働状況のお知らせ

2026/04/28 19:05

GitHub の稼働状況のお知らせ

RSS: https://news.ycombinator.com/rss

要約

Japanese Translation:

2026 年 4 月に発生した 2 件の大規模障害により、数百のリポジトリのサービスが影響を受けました。これに対し、GitHub は公式に謝罪し、「エジェント型開発」ワークフロー(特に 2025 年 12 月以来)の急速な拡大による予想外の 30 倍の需要増加を要因とする包括的な回復戦略を策定しました。同社は新機能よりも可用性を最優先とすることで、4 月 23 日のマージキューインシデント(658 のリポジトリに影響し、誤った squash merge が発生)や 4 月 27 日の Elasticsearch サブシステムへの過負荷といった重大なボトルネックに対処しました。レジリエンスを確保するため、GitHub は Azure への移行、Go 言語への採用による Ruby モノリシックからのクリティカルワークロードの移行、マルチクラウドアーキテクチャの導入、大規模なプルリクエストボリュームに対応した API デザインの最適化等により、単一障害点を排除しています。短期的な即時対策としてはデータベースボトルネックの解消やキャッシュ性能の向上を実施し、長期的な投資としては Git サービスと Actions サービスの分離に焦点を当てています。また、GitHub は可用性指標を含むステータスページの更新など、透明性の向上を図り、エジェント型開発ワークフローのような期待外の負荷下でもより高い安定性が保証されることを、GitHub Actions を依存している企業に約束しています。

Text to translate:

Following two major outages in April 2026 that disrupted services for hundreds of repositories, GitHub has officially apologized and outlined a comprehensive recovery strategy driven by an unexpected 30X increase in demand due to rapid growth in "agentic development" workflows (specifically since December 2025). The company established availability as its top priority over new features, addressing critical bottlenecks such as the April 23 merge queue incident—which affected 658 repositories and caused incorrect squash merges—and the April 27 overload of the Elasticsearch subsystem. To ensure resilience, GitHub is eliminating single points of failure by migrating critical workloads from a Ruby monolith to Go on Azure, adopting a multi-cloud architecture, and optimizing API designs for massive pull request volumes. Immediate short-term fixes included resolving database bottlenecks and improving caching, while long-term investments focus on isolating Git and Actions services. Additionally, GitHub is enhancing transparency through updated status pages with availability metrics, ensuring businesses relying on GitHub Actions can expect greater stability even under unexpected load.

本文

GitHub の利用状況について、最近発生した 2 つの出来事を踏まえ、お知らせいたします。これら 2 つの事象は決して許容されるものではありませんが、お客様にご迷惑をおかけし、重ねて謝罪申し上げます。それぞれの詳細と、信頼性の向上に向けた今進行中の対応策につきまして共有いたします。

背景と現状

GitHub の容量を 10 倍に増強する計画は、2025 年 10 月から実施を開始しており、信頼性とフェイルオーバー体制の大幅な改善を目標としておりました。しかし、2026 年 2 月時点では、今後必要となる設計規模が現在の約 30 倍に拡大することが明らかとなりました。

この急激な変化の主な要因は、ソフトウェア開発手法の急速な進化にあります。2025 年 12 月末以降、エージェント型開発ワークフローの加速が見られます。リポジトリの作成、プル・リクエスト活動、API 利用量、自動化処理、大規模リポジトリへの負荷など、あらゆる指標において急成長が進展しています。

このような指数関数的な成歩は、単一のシステムのみを圧迫するものではありません。1 つのプル・リクエストが、Git ストレージ、マージ可否チェック、ブランチ保護機能、GitHub Actions、検索機能、通知、権限管理、Webhook、API、バックグラウンドジョブ、キャッシュ、データベースなど、多岐にわたるシステムを巻き込む可能性があります。規模が大きくなるにつれ、小さな非効率性が蓄積し、キューの深まり、キャッシュミスの増加によるデータベース負荷の上昇、インデックスの追従不能、リトライによるトラフィック増幅、そして単一の遅延要因が複数の製品体験に影響を及ぼすといった現象が生じます。

当社の優先順位は明確です。第一に「可用性」、次に「容量」、そして「新機能」 です。不要な作業を削減し、キャッシュパフォーマンスを向上させ、重要なサービスを特化させることで障害発生領域を最小化し、単一障害点を排除しつつ、パフォーマンス感度が高いパスを高スケーラビリティなシステムへ移行しています。これは分散システムとしての課題であり、隠れた結合を減少させ、障害の波及範囲を制限し、サブシステムが圧力下にある際にも GitHub が順応的に動作することを目指しています。進捗は著しいものがありますが、これらの事象もなお解決すべき課題を示している例でもあります。

実施中の対応策

短期的には、想定以上に早く顕在化したさまざまなボトルネックを解消する必要がありました。Webhook を別のバックエンド(MySQL から)へ移行したり、ユーザーセッションキャッシュの再設計を通じて認証・権限フローを見直し、データベースへの負荷を大幅に削減したりしました。また、Azure への移行を加速させ、多数のコンピューティングリソースを確保しています。

次に注力したのは、Git や GitHub Actions など重要なサービスを他のワークロードから隔離し、単一障害点を最小化することで障害の波及範囲を縮小させることです。この作業は、依存関係やトラフィックの階層に関する慎重な分析から始まり、「何を分離すべきか」「どのように攻撃や異常により正規トラフィックへの影響を最小限に抑えられるか」を理解することからスタートしました。そしてリスクの高順位に従って対処を進めてきました。同様に、パフォーマンスやスケーラビリティの影響を受けやすいコード部分について、Ruby のモノリシック構造から Go へ移行するプロセスも加速させています。

公営クラウドへの移行は既に進行中でございますが、マルチクラウドへの移行経路についても着手しています。この長期的な対応は、将来必要となるレベルのレジリエンス、低レイテンシー、および柔軟性を達成するために不可欠です。

GitHub 上のリポジトリ数はかつてないスピードで増加しており、より困難なスケーリング課題として「大規模モノリポジトリ」の台頭が挙げられます。過去 3 ヶ月間、Git システム内ならびにプル・リクエスト体験においてこの傾向に対応するために多大な投資を行ってまいりました。

別の記事にて、実施した広範な作業と、効率性・スケーラビリティを高めるための新 API デザインについて詳しく発表いたします。また、この取組みの一環として、1 日数千件のプル・リクエストを受付けるリポジトリにとって極めて重要なマージキュー操作の最適化にも投資を進めています。

最近の事象

2 つの最近の事象は原因や影響が異なっていましたが、どちらも「可用性」「隔離」「障害領域の縮小」への注力をさらに強化する必要があることを示しています。

4 月 23 日のマージキュー事象

4 月 23 日、プル・リクエストにおいてマージキュー操作に影響を及ぼす回帰(regression)が確認されました。

  • 影響内容: マージキューを使用してマージされたプル・リクエストのうち、マージグループに複数件のプル・リクエストが含まれる場合、スクワッシュマージ法によって生成されるマージコミットに誤りが生じるケースが見られました。影響を受けたケースでは、以前にマージされたプル・リクエストおよび過去のコミットの更新が、後続のマージによって誤って元に戻されてしまいました。
  • 影響範囲: 影響期間中、658 のリポジトリと 2,092 のプル・リクエストに影響を及ぼしました。当初は第一の評価を意図的に保守的に行うため、やや高い数字で共有しておりましたが、実際の数は上記の通りです。マージキュー外で行われたプル・リクエストには影響が及びませんでしたし、マージまたはリベース手法を使用したマージキューグループにも影響はありませんでした。
  • データの扱い: データの損失はありませんでした。すべてのコミットは Git 内に正常に保存されております。しかし、影響を受けたデフォルトブランチの状態が正しくならず、すべてのリポジトリを自動的に安全に修復することができませんでした。事象の根本原因分析の詳細については別途入手可能です。
  • 対応: この事象は複数のプロセスにおける失敗要因を露呈しましたが、当該タイプの問題が再発しないよう、これらのプロセスを変更する措置をとっております。

4 月 27 日の Elasticsearch サブシステム事象

4 月 27 日、プル・リクエスト、イシュー(Issue)、プロジェクトなど、GitHub 内の複数の上層検索ベースの体験を支える Elasticsearch サブシステムに影響が出ました。

  • 現状: 根本原因分析の完了は進行中で、近日中に公表いたします。現時点で確認されているのは、クラスターが過負荷になり(おそらくボットネット攻撃によるもの)、検索結果を返さなくなったことです。データ損失はなく、Git 操作や API には影響がありませんでした。しかし、検索に依存する UI の一部では結果が表示されず、大きな混乱を招いてしまいました。
  • 対策と課題: これは他の領域よりもリスク優先度の低い位置づけの信頼性向上タスクの一つであり、完全な隔離を行っていなかった単一障害点のシステムであることが判明しました。この影響は許容不能でしたが、前述と同じ依存関係と障害波及範囲の分析を用い、将来此类の失敗が発生する可能性とその影響を軽減していく方針です。

透明性の向上

お客様からは「事象発生時のより高い透明性が必要」という明確なフィードバックを受けております。

  • ステータスページの改良: GitHub ステータスページに可用性数値を含めるよう更新いたしました。
  • 事象報告の方針: 大規模か小規模かを問わず、すべての事象についてステータスを報告する方針を固めました。これにより、問題がお客様側か GitHub 側のものかを推測する必要がなくなります。
  • 分類と報告の改善: 事象のカテゴリー分類を継続的に改善し、規模や範囲を理解しやすくしています。また、お客様から事象を報告いただくとともに、中断中の状況について私たちに知らせる方法についても、さらに工夫を進めております。

私たちのコミットメント

GitHub の役割は、常にオープンで拡張可能なプラットフォーム上で開発者を支えることにあります。 GitHub チームの皆様の尽力に深い敬意を表します。お客様にご迷惑をおかけし、すべてのメール、ソーシャルメディア上の投稿、サポートチケットを読み込み、心から受け止めさせていただきました。深くお詫び申し上げます。

私たちは、可用性の改善、レジリエンスの向上、ソフトウェア開発の未来に向けたスケーリング、そして透明性の高い情報共有に邁進してまいります。


編集者の注: この記事は 2026 年 4 月 28 日に更新され、4 月 23 日の事象において影響を受けたリポジトリ数の記載が修正されました。

著者について

ヴラディミル・フェドロフ(Vladimir Fedorov) は GitHub の CTO です。エンジニアリングのリーダーシップとイノベーション分野で数十年にわたる経験を持ち、開発者の生産性を支援する情熱的な提唱者です。「開発者ファースト」の精神を掲げ、GitHub のエンジニアチームを率い、developer ツールの未来とイノベーションを形作っております。

GitHub に参加する前は、データガバナンスおよびプライバシーを専門とするスタートアップ企業「UserClouds」と共に創業いたしました。その前は、現在の Meta(旧 Facebook)でシニア・バイスプレジデントとして Privacy、Ads、Platform のエンジニアリングチームを率い、2,000 人以上のチームを指揮しておりました。キャリアの初期には Microsoft で勤務し、カリフォルニア工科大学(Caltech)からコンピューターサイエンスの学士号と修士号を取得しております。現在では、AI ネイティブ世代のエンジニアや CTO、創業者の育成を目的とした Codepath.org の運営委員を務めております。

ベイエリアに在住であり、仕事以外では家族との時間やアウトドア、水辺でのアクティビティを楽しんでおります。

同じ日のほかのニュース

一覧に戻る →

2026/04/29 4:44

Ghostty は GitHub から撤退します。

## Japanese Translation: GitHub ユーザー 1299 が 18 年にわたり作成・維持してきたターミナルエミュレータ Ghostty が、プラットフォーム上の重要なインフラ障害の発生により、創始者が現在それを重大な業務に不適切と見なし始めたことを受け、公式に GitHub を離れる予定である。最近の GitHub Actions の停電は数時間ほど PR レビューをブロックし、これは Git そのものの問題ではなく GitHub サービス自体の構造的な問題を浮き彫りにしている。同月中盤の主要な GitHub 障害(同日に Elasticsearch の障害も発生したが別の事件)と時期を同じくしてこの週に終了した議論が、プロジェクトの移行計画を見事に実現させながら、現在の URL で即時のコードアクセスのために読み取り専用ミラーを維持するという方針で進められた。創始者は、新たなホスティングソリューションを探す過程で、商業的およびフリーソフトウェアの複数のプロバイダーから依存関係を段階的に削除していくことを意図している。この動きは、不揃いなサービスレベルを持つ主要プラットフォームに依存するオープンソースプロジェクトの長期的な持続可能性に対する業界全体の懸念の高まりを示しており、維持者は利便性よりも安定性を最優先することを促している。

2026/04/29 8:54

ChatGPT も広告を表示しています。以下がその全体的な帰属循環のプロセスです。

## Japanese Translation: OpenAI は、ChatGPT に独自の広告システムを直接統合し、SSE ストリームに `single_advertiser_ad_unit` オブジェクトを注入し、クリエイティブ資産を独自ドメインである `bzrcdn.openai.com` 上にホストしています。ブラウザには OAIQ v0.1.3 という追跡用 SDK が実行されており、製品の閲覧情報を OpenAI のサーバーへ報告しています。このシステムは Fernet 暗号化されたトークン(例:`ads_spam_integrity_payload`, `oppref`, `olref`, `ad_data_token`)を使用しており、これらは公衆向けのヘッダーバイトを 9 文字含み、トークンの発行時刻の復元を可能にしています(例:2026 年 4 月 26 日)。クリックされたリンクは外部ではなく ChatGPT の内部ウェブビュー内(`open_externally: false`)で開かれるため、OpenAI はクリック後のナビゲーションを観察できます。アトリビューションチェーンには、720 時間の有効期限を持つファーストパーティcookieに格納されるフォワードトークン(`__oppref`)と、impression ログを記録する `olref` が使用されます。コンテキストターゲティングは、北京旅行、フライト、NBA など 6 つの異なる会話トピックで確認されています。広告出稿元には Grubhub や GetYourGuide があります。追跡を軽減するには、ドメイン `bzrcdn.openai.com` と `bzr.openai.com` をフィルタリングし、cookie(例:`__oppref`, `__oaiq_domain_probe`)を確認する必要があります。

2026/04/29 6:17

GitHub に至るまで

## 日本語訳: 中心的な論点是、GitHub が有用なツールから、オープンソースのアイデンティティに依存する脆弱で中央集権的なインフラへと進化しすぎているという点にある。この依存関係は危険であり、企業の管理不備と不安定性が、過去の記録と長年にわたって構築されたコミュニティへの信頼の双方を脅かしている。GitHub はコード共有を円滑化させ、事実上のプロジェクト放棄フォーク、イシュー、議論などのアーカイブとなったが、その台頭は npm エコシステムなどにおけるマイクロ依存関係の爆発的増加と同時期に起きたものである。 GitHub を以前に、オープンソースは評判、メーリングリスト、信頼できるメンテナ、そしてより多くの管理努力を要するが制御とコミュニティの文脈を保持できる自己ホスト化インフラ(例:Trac、Subversion)などに基づいていた。Git の分散型の性質が広く普及したにもかかわらず、GitHub はホスティングを単一の商用エンティティに集約し、これはソフトウェアコモンズの皮肉な中央集権化である。今日では、いくつかのプロジェクト(Ghostty、Strudel、Tenacity など)は、不安定なベンダーへの依存を回避するために、Codeberg などの独立したホスティングへ移行している。 今すぐ必要なのは、商業的モデルから完全に切り離された、公衆向けの資金を十分に得たアーカイブを作り、重要コード、リリースアソートメント、およびセキュリティ勧告や設計論争などを含む歴史的議論を保存することである。現在のようにプラットフォームの変更や急激な移行によって消えてしまう場合である。そのようなレジリエントなバックアップがない場合、業界は社会的歴史の不可逆的な損失に直面し、コミュニティが孤立しデータが脆弱になるリスクを抱えることになる。著者は GitHub の回復を望みつつも、オープンソースの歴史に対して単一のプラットフォームへの依存は無責任であると論じており、将来には pre-GitHub 時代の教訓と GitHub エポックの実態とのバランスが必要であるべきである。

GitHub の稼働状況のお知らせ | そっか~ニュース