**Stonebraker氏のCAP定理とデータベースに関する論考**

2026/01/31 8:47

**Stonebraker氏のCAP定理とデータベースに関する論考**

RSS: https://news.ycombinator.com/rss

要約

日本語訳:

要約:
マイク・ストーンブレーカー氏は、CACMブログ記事「データベースシステムにおけるエラー、最終的な一貫性、およびCAP定理」で、CAP定理が最終的一致性を強制するという広く受け入れられているNoSQLの見解に挑戦しています。彼は、多くのデータベース障害はネットワーク分断ではなく、アプリケーション、管理、実装上のバグから生じており、実際にはパケット損失や設定エラーなど他のネットワーキング欠陥と比べても稀であると主張しています。ストーンブレーカー氏は、2ノード冗長スキームが大規模では不十分であり、業界が最終的一致性に依存することで実際の問題を隠してしまう可能性があると指摘しています。
彼はAmazon SimpleDB が最近完全一致性へ移行したことを、高いスケールでも厳密な正確性を保証できる証拠として挙げ、実用的な緩和策として「遅延削除」(削除マークを付けてからガベージコレクションを遅らせる)を提案しています。ストーンブレーカー氏は完全一致性を早期に放棄すると微妙なバグが発生し、運用リスクが増大する可能性があると警告しています。
この記事はNoSQLコミュニティに対し、多くのワークロードで最終的一致性が適切かどうかを再検討し、強い一致性が大規模でも達成できることを示唆しています。

本文

マイク・ストーンブレーカーは、昨日CACMサイトで「データベースシステムのエラー、最終的な一貫性、およびCAP定理」という優れたブログ記事を公開しました。この文書では、NoSQLコミュニティがエリック・ブルーベアのCAP定理を適用しようとすることに挑戦しています。多くの大規模NoSQLシステム開発者は、CAP定理が最終的な一貫性モデルを採用せざるを得ないと主張してきましたが、マイクはその主張に反論し、一部の一般的なデータベースエラーは最終的な一貫性によって回避できず、CAP定理は実際にはこれらの場合に適用されないことを指摘しています。

もしアプリケーションエラーや管理ミス、あるいはデータベースの実装バグでデータが失われた場合、それは単に消えてしまいます(オフラインコピーがなければ)。この点は私が遅延削除(deferred delete)を大好きな理由でもあります。遅延削除とは、アイテムを削除済みとしてマークするだけで、数日または理想的には数週間後にガベージコレクションを行う手法です。完全な保護ではありませんが、何度か助けられたので信者です。「インターネット規模のサービス設計と展開」に詳細があります。

CAP定理や最終的な一貫性は、アプリケーションエラーやデータベース実装エラーから直接保護してくれるわけではありません。大規模災害でクラスタ全体が失われた場合、最終的一致性もCAP定理も解決策を提供しません。マイクはまた、ネットワーク分割(partition)が比較的まれだと指摘しています。この点については少し異論があります:ネットワーク分割はまれであるべきですが、実際には機器が原因で予期せぬ問題を引き起こすことが多いです。設定ミスやブラックホール、パケットロスト、ブラウンアウトなどは業界全体のポストモーテムで頻繁に議論されます。この状況は今後5年で改善する見込みですが、まだ遠い道のりがあります。

「ネットワーキング:メインフレーム計算の最後の砦」では、機器が依然としてメインフレームビジネスモデル(大規模・垂直統合・高価な装置をペアで展開)に基づいていると主張しています。大規模冗長性を考えると、2つの構成は不十分です。

マイクの記事は、最終的な一貫性が本当にこれらのワークロードに適しているかどうかを問い直しています。同様のポイントは「I Love Eventual Consistency but…」で述べました。その投稿では、多くのアプリケーションが完全一致性(full consistency)で実装する方がずっと簡単であり、完全一致性は高スケールでも実際に実装可能だと主張しました。Amazon SimpleDB は最近完全一致性をサポートすると発表しました。完全一致性が必要なアプリは書きやすくなり、最終的な一貫性のみが必要な場合も利用可能です。

完全一致性を早々に棄却しないでください。多くのアプリケーションでは、完全一致性は手頃であり、実装ミスを減らす助けになります。

—jrh

Deepak Singh にこの記事へのリンクを教えていただき感謝します。

James Hamilton
e: jrh@mvdirona.com
w: http://www.mvdirona.com
b: http://blog.mvdirona.com / http://perspectives.mvdirona.com

同じ日のほかのニュース

一覧に戻る →

2026/01/31 9:51

**Show HN:** 私は自分の中国語(普通話)の声調を直すため、9Mパラメータの音声モデルを訓練しました。

## Japanese Translation: > **概要:** > AISHELL‑1 と Primewords から約300時間分の文字起こし済み中国語音声を用い、SpecAugment と4台の RTX 4090 GPU を使用して、約9 Mパラメータのコンフォーマーモデル(Conformer)を訓練しました。ネットワークは40 msごとにトークン確率を出力し、Viterbi アルゴリズムでピンイン音調トークン列(各音節+音調がユニークなトークン;中性音調はトーン5へマッピング)に沿ってアラインメントを強制します。語彙には1,254個のトークンと `<unk>`、`<blank>` が含まれます。 > このモデルでは Token Error Rate(TER)が約 5.3 %、音調精度が約 98.3 %です。INT8 量子化によりサイズを約37 MB から約11 MB に縮小し、TER は +0.0003 の増加のみで済みました。先頭の無音によるアラインメントミスを修正するため、 `<blank>` 確率が0.7 を超えるフレームは採点前に除外しました。 > 最終的な量子化モデル(約13 MB のダウンロード)は ONNX Runtime Web 経由でブラウザ上で完全に実行され、リアルタイムの発音フィードバックを可能にします。今後は Common Voice などの会話データセットを取り入れ、カジュアルまたは子供の話し言葉(通常より速く変動が大きい)に対する頑健性を向上させる予定です。 **短縮版(すべてのポイントを網羅):** > **概要:** > AISHELL‑1/Primewords から約300時間分の中国語音声で、SpecAugment と4× RTX 4090 を用いて9 Mパラメータのコンフォーマーを訓練しました。40 ms ごとにトークン確率を出力し、ピンイン‑音調語彙(1,254トークン+`<unk>`、`<blank>`)で Viterbi アラインメントを行います。TER は約 5.3 %、音調精度は約 98.3 %です。INT8 量子化によりモデルサイズが約11 MB に縮小され、TER は +0.0003 の増加のみでした。先頭無音のバグは、高い `<blank>` 確率(閾値0.7)を持つフレームを除外することで修正しました。13 MB の ONNX Runtime Web バージョンはブラウザ内で完全に動作し、即時発音フィードバックを提供します。将来的には会話データを追加してドメインシフトへの対処を図ります。

2026/01/31 5:40

ペアウェブ:WebTorrent を利用した分散型ウェブサイトホスティング

## 日本語訳: PeerWebは、WebTorrent技術を利用したピアツーピア(P2P)ネットワーク上で静的ウェブサイトを無料かつ検閲耐性のある形でホストできるサービスです。サイトはトレントハッシュ経由で配布され、少なくとも1人のユーザーがブラウザタブまたはデスクトップクライアントを開いている限りオンラインに留まります。 **動作原理:** - ユーザーはインターフェースにファイルをドラッグ&ドロップするだけで、シンプルなHTML/CSS/JSプロジェクトをアップロードできます。各サイトにはユニークなPeerWebリンクが付与され、どこからでもアクセス可能です。 - サイトは `index.html` ファイルを必ず含み、相対パスのみを使用し、静的コンテンツで構成されている必要があります。 - キャッシュ前に PeerWeb は DOMPurify で全ファイルをサニタイズし、XSS 攻撃から保護します。 - キャッシュされたサイトは IndexedDB に保存され即座に再読み込みが可能です。キャッシュは7日間の非アクティブ後に自動的にクリアされます。 **セキュリティとパフォーマンス:** - コンテンツはサンドボックス化された iframe 内でレンダリングされ、リソース検証によって正当な資産のみが表示されます。 - 開発者はデバッグモード(`&debug=true`)を有効にして詳細な進行状況とリアルタイムメトリクスを確認できます。 **使用例:** デモリンクではテストページ、SomaFM ラジオ、チェスゲーム、およびテキストエディタアプリが紹介されています。 多くのピアにコンテンツを分散させることで、PeerWeb は従来のホスティング費用なしでサイトを利用可能にし、キャッシュによる高速ロードとマルウェアからの保護を提供しつつ、検閲にも耐えます。

2026/01/29 7:46

住宅プロキシネットワーク最大規模を破壊 (Note: If a more natural phrasing is desired, one could say 「最大規模の住宅用プロキシネットワークを混乱させる」.)

## Japanese Translation: Googleの脅威インテリジェンスグループ(GTIG)は、他のチームと協力してIPIDEAの膨大な住宅プロキシネットワークを解体しました。これは世界最大級のネットワークの一つです。この作業は次の通りでした: 1. 数百万台のデバイスとプロキシトラフィックを制御するドメインの法的テイクダウン; 2. IPIDEAのSDK(Castar、Earn、Hex、およびPacket)とそれに関連するプロキシソフトウェアについて、プラットフォーム提供者、法執行機関、研究者へ詳細な技術情報を共有; 3. Google Play Protect を強化し、これらのSDKを組み込んだAndroidアプリを警告・削除・ブロック。 ネットワークは二段階のコマンド&コントロール(C2)システムで構築されていました:Tier Oneサーバーが約7,400台のTier Twoノード(IPアドレス+接続およびプロキシポート)のリストを発行し、デバイスはこれらのTier Twoノードにタスクを問い合わせ、専用接続を確立してトラフィックを未改変で対象FQDNへ転送します。 IPIDEA は 360 Proxy、922 Proxy、ABC Proxy、Cherry Proxy、Door VPN、Galleon VPN、IP 2 World、Luna Proxy、PIA S5 Proxy、PY Proxy、Radish VPN、Tab Proxy といった複数のプロキシ/ VPN ブランドを同一 C2 インフラで運用しました。SDK は Android、Windows、iOS、および WebOS アプリに埋め込まれ、600以上の Android アプリと3,075個以上のユニーク Windows PE ハッシュ(OneDriveSync や Windows Update を装ったトロイジャン)が特定されました。 住宅プロキシは消費者 ISP 所有の IP アドレスを経由してトラフィックをルーティングし、事前にロードされたソフトウェアやトロイジャ化されたソフトウェアでデバイスを出口ノードとして登録し、未使用帯域幅を攻撃者へ収益化します。 GTIG は Spur、Lumen の Black Lotus Labs、Cloudflare などの業界パートナーと協力してドメイン解決を妨害し、調査結果を共有することで広範な執行を図りました。このテイクダウンは IPIDEA のインフラを大幅に低下させ、リセラー契約経由で接続されているユーザーに影響を与え、さらなる法執行措置を促すと予想されます。 今回の事件は、デバイスセキュリティを損なう隠れSDK のリスクを浮き彫りにし、「未使用帯域幅」の支払いを提供するアプリを避けるよう消費者へ警告するとともに、プラットフォームがプロキシ登録のための透明な同意慣行を強制すべきだと訴えています。これにより無料 VPN サービスへの厳格な規制と住宅プロキシトラフィックへの tighter コントロール が加速する可能性があります。

**Stonebraker氏のCAP定理とデータベースに関する論考** | そっか~ニュース