自前でPostgreSQLを運用してみてください。

2025/12/21 0:43

自前でPostgreSQLを運用してみてください。

RSS: https://news.ycombinator.com/rss

要約

Japanese Translation:

要約

この記事では、適切に調整されたセルフホスト型PostgreSQLデプロイメントが速度・安定性・コスト面でAWS RDSと同等またはそれを上回ることができると主張しています。2年間の手動移行はわずか約30分の障害時間に抑えられ、実際の作業は4時間程度+チームが慣れるまで数週間でした。継続的な保守はほぼ不要で、週に≈10分、月に30分、四半期ごとにオプションで2時間程度です。

同等のRDSインスタンス(db.r6g.xlarge 1か月あたり$328)を、32コア・256 GB RAM の専用サーバーで置き換えることができ、月額費用はほぼ同じになります。RDSはChef/Puppet/Ansible、EBSスナップショット、PgBouncer、CloudWatch など便利なツールを提供しますが、基盤となるPostgreSQLエンジン自体には変化がないため、慎重にチューニングすればパフォーマンスはマッチまたは上回ることが可能です。

主なチューニングポイントは以下の通りです:

  • shared_buffers
    ≈ RAM の25%
  • effective_cache_size
    ≈ RAM の75%
  • 保守的な
    work_mem
    、十分に大きい
    maintenance_work_mem
  • PgBouncer を用いた接続プール(
    max_connections=200
    、ログを有効化)
  • NVMe SSD 設定:
    random_page_cost
    を低く設定(1.1 代わりに 4.0)、
    seq_page_cost=1.0
    を維持、
    effective_io_concurrency
    を高める(約200)
  • WAL 設定:
    wal_level=replica
    max_wal_size=2 GB
    min_wal_size=1 GB
    checkpoint_completion_target=0.9

運用タスクには、週次のバックアップ検証、スロークエリレビュー、ディスク空き容量監視;月次で更新・ローテーション・キャパシティ計画;四半期ごとの最適化と災害復旧テストが含まれます。

2017年のUS‑East‑1障害はRDSも失敗する可能性を示し、メンテナンスウィンドウを完全にコントロールできる価値を強調しています。ほとんどのチームにはセルフホスティングが推奨されますが、例外として非常に小規模なスタートアップ(高速APIセットアップ)、専門的DBエンジニアを持つ大企業、またはBAA/コンプライアンス証明が必要な規制ワークロードがあります。

この記事ではハイブリッドの未来を予測しています。価値を追加できる箇所でマネージドサービスを利用し、コアPostgreSQLワークロードは専用ハードウェア上で実行することでコスト削減・チューニング制御向上・プロバイダー障害のリスク低減を図ります。

本文

自分でデータベースをホスティングすると、恐ろしいイメージが付きやすいですが、実際には意外にシンプルに運用できることが多いです。


「危険だ」と言われるストーリー

  • 自前のデータベースはリスクが高い
    クラウドプロバイダーと同等の信頼性をどう確保するか?

  • 専任のデータベースエンジニアが必要
    自分で採用したり、外部に委託したりする手間がある。

これらはマーケティングによって大げさに語られがちですが、実際にはほとんどのクラウドホストもオープンソースのPostgreSQLをわずかに改変したバージョンを使っています。


本当に重要なのは

  1. パフォーマンスはクエリ次第 – 悪く書かれたクエリがどんな環境でも性能を落とします。
  2. 抽象化は診断情報を隠すこともある – 直接制御できることでベンチマークや微調整が可能になります。

私はサードパーティのサービスでデータ破損を経験した回数も自前で運用した場合と同等でした。ところが、自分でPostgreSQLを2年間稼働させた結果は:

  • マニュアル移行時に30分以内で完了
  • コスト低く高速・安定した運用
  • 夜間の安心感

歴史的背景

時代典型的な構成クラウドへのシフト
1980年代〜2000年代初頭アプリケーションサーバーと同一マシン上のオンプレミスDBなし – ローカル通信が高速だったため
2009年Amazon RDS が登場:バックアップ、パッチ適用、HA、モニタリングを価格帯で提供初めてのマネージドサービス
~2015年クラウド採用加速;インフラは「重い作業」と見なされるようにマネージドサービスが標準化
2025年RDS の価格上昇(例:
db.r6g.xlarge
≈ $328/月)
自前ホスティングのコスト効果が高まる

クラウドプロバイダーが実際に走らせているもの

AWS RDS などは基本的に:

  • 標準PostgreSQL + AWS の監視フック
  • EBS スナップショットでのカスタムバックアップ
  • Chef/Puppet/Ansible 等による設定管理
  • ロードバランサー & PgBouncer による接続プール
  • CloudWatch 連携
  • 自動フェイルオーバースクリプト

エンジン自体は変更されていません。価値は運用ツールにあります。


移行経験

RDS から DigitalOcean の専用ドロップレット(16 vCPU / 32 GB RAM / 400 GB ディスク)へ移行したケース:

  1. ダンプ&リストア – 性能は同等、時にはチューニングパラメータで向上
  2. 初期作業 – 約4時間の手動作業 + 習得に数週間
  3. 運用サイクル(デプロイごと)
頻度タスク時間
週1回バックアップ検証、スロークエリレビュー、ディスク容量トレンド10分
月1回セキュリティ更新、バックアップローテーション、キャパシティプランニング30分
四半期(任意)ダッシュボード更新、設定最適化、DRテスト2時間

主な違いは「インシデント対応を自前で行う」点です。クラウド障害は依然として発生しますが、その解決策はあなたの手にあります。


自前ホスティングが適さないケース

  • 初心者 – Postgres をリモート API として扱い、プロトタイピングを迅速化。
  • 大規模企業 – 専任 DB エンジニアとクラウドのスケールメリットを活かすほうが効率的な場合もある。
  • 規制対象ワークロード(PCI-DSS、HIPAA 等) – 署名済み BAA やコンプライアンス証明を必要とするマネージドプラットフォームが必須。

主なチューニングパラメータ

パラメータ推奨設定理由
shared_buffers
RAM の 25%クエリキャッシュの核
effective_cache_size
RAM の 75%OS キャッシュをプランナーに知らせる
work_mem
total_RAM / max_connections / 2
または約32MB
操作ごとのメモリ
maintenance_work_mem
1–2GBVacuum・インデックス操作用

接続管理

max_connections = 200
shared_preload_libraries = 'pg_stat_statements'
log_connections = on
log_disconnections = on

PgBouncer 等のプールャーを使い、接続ごとのオーバーヘッドを削減。

NVMe ストレージチューニング

random_page_cost = 1.1
seq_page_cost = 1.0
effective_io_concurrency = 200

NVMe SSD のランダム・シーケンシャル読み込みがほぼ等価であることを反映し、プランナーの判断を改善。

WAL 設定

wal_level = replica
max_wal_size = 2GB
min_wal_size = 1GB
checkpoint_completion_target = 0.9

耐久性と I/O パフォーマンスのバランスを取る。


結論

自前ホスティングは万能解ではありませんが、マネージドサービスへの偏りは過剰です。適切な範囲で自前運用を行えば、同等の信頼性を低コストかつ高い制御力で実現できます。

実践的次のステップ:
RDS で月額 $200 を超えているなら、Hetzner や OVH のような安価プロバイダーでテストサーバーを立ち上げ、非重要データベースを移行してみてください。将来のインフラはハイブリッドが主流になるでしょう:本当に価値を付けるマネージドサービスのみ利用し、コスト削減と信頼性確保に自前ホスティングを活用する―これが最適な戦略です。

同じ日のほかのニュース

一覧に戻る →

2025/12/21 3:28

**Spotify のバックアップ**

## Japanese Translation: ``` ## Summary Anna’s Archive は、Spotify のカタログのほぼ全て(約 2億5600 万曲と 1億8600 万個のユニーク ISRC コード、Spotify 再生回数の約 99.6 %)を収録した、大規模で公開アクセス可能な保存プロジェクトを開始しました。アーカイブには約 8,600 万曲(≈300 TB)の音楽ファイル、SQLite データベースに格納された 200 GB 超の圧縮メタデータ、および音声特徴量データ(テンポ、キー、ダンス性など)を含む約 4,000 万行が含まれています。 配布は人気順でグループ化した大量トレント経由です。トップ 10,000 曲は OGG Vorbis 160 kbit/s で提供され、順位の低い曲は OGG Opus 75 kbit/s に再エンコードされています。追加コンテンツとしては、ファイル名プレフィックスでインデックスされたアルバムアートを含む tar‑torrent と、オーディオブック(約 70 万行)、オーディオブック章(約 2000 万件)、ポッドキャスト/ショー(約 500 万件)、エピソード(約 5400 万件)の原始 JSON データセットがあります。アーカイブには再エンコード状況、SHA256 ハッシュ、ライセンス情報、歌詞、言語、およびアーティストの役割を含む詳細な `track_files` テーブルもあります。 プレイリストデータも収録されています:フォロワー 1,000 人以上の約 660 万プレイリストがあり、総曲数は 17 億曲に達します。メタデータは 2025 年 12 月に発表され、音声ファイルは人気順で提供され、2025 年 7 月を境に追加されたトラックは欠落している可能性があります。Anna’s Archive はトレントのシーディングと寄付を奨励し、継続的な保存活動を支援しています。 研究者・AI 開発者・デジタルアーカイブ担当者にとって、このプロジェクトは Spotify のライブラリを分析、モデル学習、遺産保全のために利用できる前例のない高品質なスナップショットを提供し、ストリーミング業界における長期データ管理の新たな標準となり得ます。 ```

2025/12/21 4:56

アイルランド出身のディアムウィッド・エーリーが、マイクロソフト・エクセル世界選手権で優勝しました。

## Japanese Translation: Diarmuid Early はラスベガスで開催された 2025 年 Microsoft Excel ワールドチャンピオンシップを制覇し、60,000 ドルの賞金と選手権ベルトを獲得しました。この大会には世界中から 256 名の競技者が集まり、連続ノックアウトラウンドの後、24 名のファイナリストがタイム付きでグローバルに配信されるアリーナで対戦しました。試合は 30 分間ごとのチャレンジに分かれ、難易度が段階的に上昇し、正しいスプレッドシートの回答にポイントが与えられました。5 分ごとに自動的に「Thanks for playing, you’re out」というメッセージで除外されます。Early は「Excel スプレッドシートのレブロン・ジェームズ」と称され、ガリウイ出身でウォーターフォード育ち、現在はニューヨークで金融ビジネスを運営しています。彼はこのニックネームを自分の身長に起因するとユーモラスに語ります。3 回連続チャンピオンであるオーストラリア人アクチュエリスト Andrew Ngai を破りましたが、**全体で 2 位**となりました。 Excel e‑スポーツは金融中心の対戦から迷路ナビゲーション、ポーカー手札評価、カードソートバトルなど創造的な問題解決タスクへと移行し、コミュニティを活性化させています。大規模な WhatsApp グループが新参者にヒントや戦略の議論を提供しています。 今後は「Road to Las Vegas Battle」が 2026 年 1 月 22 日に開始され、オープン登録が行われます。Early の勝利は企業からの関心を呼び、彼はスプレッドシートコンサルティングを提供し、YouTube でウォークスルービデオをホストしています。 この選手権の可視化は Excel コンペティションへの企業エンゲージメントを高め、専門的なスプレッドシート研修需要を増加させる可能性があります。拡張されたストリーミングとコミュニティプラットフォームは参加者数をさらに伸ばす一方で、進化するトーナメント形式が金融・テックセクター全体でスプレッドシートスキルのマーケティング方法を再構築するかもしれません。

2025/12/21 6:00

**Show HN:** *Jmail – エプスタインファイル専用 Google スイート*

## Japanese Translation: **要約はすでにキーポイントリストの内容を正確に反映しており、追加の推測や曖昧な表現が含まれていないため、そのまま最終版として繰り返すことができます。** --- ## 最終まとめ 記事全体の内容は「Loading Jmail…」というフレーズです。これは単にJmail というプログラムまたはアプリケーションが起動中であるか、情報を取得している状態を示しています。追加の文脈・背景・今後の行動や影響については提供されていません。

自前でPostgreSQLを運用してみてください。 | そっか~ニュース