Kubernetes のコスト見積もりと CUR/FOCUS 請求データを照合する

2026/05/30 2:06

Kubernetes のコスト見積もりと CUR/FOCUS 請求データを照合する

RSS: https://news.ycombinator.com/rss

要約

Japanese Translation:

サマリー:

burn
は、外部エージェントや複雑な YAML 設定を必要とせず、直ちにクラウド支出の可視性を提供することを目的としたゼロセットアップの Kubernetes コスト分析ツールです。Homebrew、バイナリ、Docker、Helm、または Go を介して利用可能であり、AWS、Azure、Google Cloud およびオンプレミス環境(GPU クラスターを含む)すべてで完全にカバーされます。本ツールは、スポットインスタンスやロードバランサーのような重要なリソースを賢く検出することで、追跡のギャップを防ぎます。

そのプライシングエンジンは、認証情報が利用可能な場合にリアルタイムクラウド API を最優先し、欠落している場合は 600 ア上の AWS インスタンスタイプおよび 300 ア上の Azure インスタンスタイプを格納した埋め込みデータベースにフォールバックします。さらに、未知のタイプについては静的なフォールバックレートを適用します。これにより、基本分析のために完全な認証を行わなくても、計算資源、ストレージ、ネットワーク支出のコストを正確に計算することが保証されます。

実行可能なインサイトを提供するため、

burn
は時間帯に応じた分析(例:週間平均)をサポートし、Slack と
/burn
スラッシュコマンドを介して統合されます。Anthropic API キーを有する場合は、非効率なイングレスロードバランサーや過剰プロビジョニングされた CPU リクエストのような廃棄物を特定する AI 駆動の自然言語レポートを提供し、CPU リミットの削減や LB タイプの変更など、特定のコマンド(例:
kubectl scale deployment...
)を提案してコストを節約することをしばしば示します。組織は、Helm CronJob を展開することでこれらのインサイトを自動化し、週次報告を行うことができます。Apache 2.0 ライセンスの下で提供され、本ツールはユーザーがオンプレミスクラスターのためにカスタムプライシングレートを設定可能にするとともに、オペレーショナルオーバーヘッドなしにインフラ Bills の包括的な内訳を提供します。

本文

Kubernetes クラスタのコスト最適化ツール Burn

Burn は、Kubernetes クラスタの資金燃費を可視化するツールです。エージェントのインストール、ダッシュボードの維持、YAML の設定は一切不要で、設置して即座に実行できます。


採用の理由 (Why Burn?)

以下の特性により、クラウドコストの可視化と最適化をシンプルに実現します。

  • ゼロセットアップ: Homebrew で 1 コマンドの実行だけで利用可能。エージェントや設定ファイルは不要です。
  • 完全なコスト把握: 仮想マシン、ストレージ、ロードバランサー、GPU のコストをリアルタイムのクラウド基準で把握できます。
  • AI 搭載機能: エンゲジされた英語での質問に対し、コピー&ペースト可能な
    kubectl
    コマンドを返します。
  • Slack ネイティブ:
    /burn
    と入力するだけでレポート表示。
    /burn ask "..."
    で AI による詳細分析も可能です。
  • マルチクラウド対応: AWS EKS、Azure AKS、GCP GKE およびオンプレミス環境に対応しています。
  • スポット (Spot) インスタンス最適化: リアルタイムの割引率と中断確率に基づき、どのワークロードを Spot へ移行すべきかを特定します。
  • ロードバランサー検出:
    Service
    および
    Ingress
    の両方からロードバランサーを検出し、ホスト名の重複を防ぎます。
  • タイムアウェア計算: スナップショットではなく、
    --period 7d
    を指定することで週平均を正確に計算します。

インストール方法

環境に合わせて以下のいずれかの方法でインストールしてください。

Homebrew (推奨)

brew install tanrikuluozlem/burn/burn
# バージョンアップ時は以下を実行
brew upgrade tanrikuluozlem/burn/burn

バイナリ (手動インストール)

VERSION=$(curl -s https://api.github.com/repos/tanrikuluozlem/burn/releases/latest | grep tag_name | cut -d'"' -f4 | tr -d 'v') && \
curl -L "https://github.com/tanrikuluozlem/burn/releases/latest/download/burn_${VERSION}_$(uname -s | tr '[:upper:]' '[:lower:]')_$(uname -m | sed 's/x86_64/amd64/;s/aarch64/arm64/').tar.gz" | tar xz

Docker

docker pull ghcr.io/tanrikuluozlem/burn:latest

Helm

git clone https://github.com/tanrikuluozlem/burn.git
helm install burn ./burn/charts/burn

Go (ソースからビルド)

go install github.com/tanrikuluozlem/burn/cmd/burn@latest

※ macOS 向け: Gatekeeper の警告が表示された場合は、以下を実行して解除してください。

sudo xattr -d com.apple.quarantine $(which burn)

クイックスタート

プロメス (Prometheus) との連携でコスト分析を開始します。

基本的なコマンド例

コマンド説明
burn analyze
プロメスなしでのコスト詳細内訳取得
burn analyze --prometheus http://prometheus:9090
プロメス連携での分析
burn analyze --prometheus http://prometheus:9090 --period 7d
7 日間の平均値を計算
burn analyze --prometheus http://prometheus:9090 --namespace argocd
特定の名前空間 (
argocd
) の詳細分析
burn analyze --prometheus http://prometheus:9090 --spot
スポットインスタンス移行可能性の確認

AI アナリティクスと推奨アクション

クラスター全体の無駄や、特定の namespace に対する推奨アクションを取得します。

# 7 日間平均と AI 分析
burn analyze --prometheus http://prometheus:9090 --period 7d --ai

# 特定の namespace 限定
burn analyze --prometheus http://prometheus:9090 --namespace app-backend --ai

# 直接質問形式
burn ask --prometheus http://prometheus:9090 "argocd はなぜこんなに高価なのか?"

AI の出力例と自動生成される
kubectl
コマンド

AI は以下のような詳細なレポートと、コスト削減のための具体的なコマンドを返します。

  • リソース過剰プロビジョニング: p95 使用率に基づき CPU/メモリリクエスト量の再調整提案。
  • ロードバランサー最適化: 内部通信のみ利用される Service を
    ClusterIP
    に切り替える提案。
  • VPA 推奨: Vertical Pod Autoscaler の有効化による過剰プロビジョニングの防止。

スポット (Spot) レディネス機能

各インスタンスタイプについて、リアルタイムのスポット割引率と中断確率を表示し、移行候補を特定します。


平易な英語での質問

AI 分析機能を有効化するには、以下の環境変数を設定する必要があります。

export ANTHROPIC_API_KEY="your_api_key_here"

Slack インテグレーション

Burn を Slack ボットとして実行し、チャート内でコスト報告を行うことができます。

実働方法

  1. サーバー起動:
    burn serve --port 8080 --prometheus http://prometheus:9090 --period 7d
    
  2. スラッシュコマンド: チャット内で
    /burn
    と入力するだけでコストレポートが表示されます。
  3. 高度な分析:
    /burn ask "..."
    で AI に質問できます。

Slack 設定手順

  1. Slack Apps から新しい App を作成します。
  2. スラッシュコマンド
    /burn
    を追加し、サーバー URL +
    /slack
    を指すように設定します。
  3. 以下の環境変数を設定します:
    • SLACK_SIGNING_SECRET
    • ANTHROPIC_API_KEY
      (AI 機能を有効化する場合)
  4. サーバーを公開します(テスト用には
    ngrok
    、本番用にはロードバランサーなどを介します)。

コマンドリファレンス

スラッシュコマンド得られる内容
/burn
完全なコストレポート(ノード、名前空間、アイドルコスト、ロードバランサー、ストレージ)
/burn ns <namespace>
特定の namespace 単位の Pod レベルの詳細内訳
/burn ask "<質問>"
kubectl
コマンド付きの AI 分析

オンプレミスおよび GPU クラスタ対応

Burn はオンプレミス環境や GPU クラスタでも動作します。独自の資源単価を設定して分析可能です。

burn analyze \
  --cpu-price 0.05 \    # コアあたりの CPU コスト (1 時間)
  --ram-price 0.008 \   # GiB あたりのメモリ コスト (1 時間)
  --gpu-price 3.00 \    # GPU ユニットあたりのコスト (1 時間)
  --storage-price 0.10 # GiB あたりのストレージ コスト (1 ヶ月)

: クラウドクラスタの場合、これらのフラグは指定せず、クラウド標準のリアルタイム価格が自動的に使用されます。


仕組み (アーキテクチャ)

Burn は以下のコンポーネントを読み取ってコストを計算・分析します。

  1. Kubernetes API: ノード、Pod、PVC、Service、Ingress の状態を取得。
  2. Prometheus: 実際の CPU およびメモリの使用量(オプション)を取得。
  3. Cloud Pricing: AWS、Azure、GCP のリアルタイム価格を参照。
  4. Cost Engine: 計算リソース、ストレージ、ロードバランサー、GPU、アイドル状態の検出と集計。
  5. 出力: CLI、Slack ボット、AI 推奨アクションへ提供。

価格情報源の優先度

  1. AWS/Azure プライシング API: クレデンシャルが存在する場合(リアルタイムかつリージョンに即した情報)。
  2. 組み込み価格データベース: クレデンシャルがない場合(600+ AWS、300+ Azure インスタンスタイプを週更新収録)。
  3. 静的フォールバック: インスタンスタイプが不明な場合(インスタンスファミリーに基づく見積もり)。
  • ストレージおよびロードバランサーは、API が存在しない場合は静的フォールバック値を使用。
  • GPU ノードは自動検出され、比率ベースのコスト分割により価格付けが行われます。

Kubernetes へのデプロイ

Helmチャートでのインストール

git clone https://github.com/tanrikuluozlem/burn.git
helm install burn ./burn/charts/burn \
  --set prometheus.url=http://prometheus:9090 \
  --set schedule="0 9 * * 1-5"

CronJob (日次 Slack リポート用 YAML)

定期的なレポート生成と Slack 送信用の設定例です。

apiVersion: batch/v1
kind: CronJob
metadata:
  name: burn-report
spec:
  schedule: "0 9 * * 1-5"
  jobTemplate:
    spec:
      template:
        spec:
          containers:
          - name: burn
            image: ghcr.io/tanrikuluozlem/burn:latest
            args:
            - analyze
            - --prometheus=http://prometheus-server.monitoring:80
            - --period=7d
            - --ai
            - --slack
            env:
            - name: ANTHROPIC_API_KEY
              valueFrom:
                secretKeyRef:
                  name: burn-secrets
                  key: anthropic-api-key
            - name: SLACK_WEBHOOK_URL
              valueFrom:
                secretKeyRef:
                  name: burn-secrets
                  key: slack-webhook-url
          restartPolicy: OnFailure

設定項目詳細

環境変数

変数名説明必要な場合
ANTHROPIC_API_KEY
Claude API キー (AI 機能用)
--ai
,
ask
,
serve
SLACK_WEBHOOK_URL
Slack ウェブフック URL
--slack
SLACK_SIGNING_SECRET
Slack App の署名シークレット
serve
(ボットとして動作時)

コマンドラインフラグ

フラグ説明使用対象
--cpu-price
オンプレミス時の CPU コスト (コア/1 時間)オンプレミス
--ram-price
オンプレミス時のメモリ コスト (GiB/1 時間)オンプレミス
--gpu-price
オンプレミス時の GPU コスト (ユニット/1 時間)オンプレミス
--storage-price
オンプレミス時のストレージ コスト (GiB/月)オンプレミス
--spot
スポットインスタンス移行可能かの詳細表示全環境

: クラウドプロバイダーから価格情報を取得できないオンプレミス環境においてのみ、これらのフラグを使用します。


開発者向け

ビルドとテストの実行方法です。

make build    # バイナリの構築
make test     # テストの実行
make lint     # リンターの実行

ライセンス

本ツールは Apache 2.0 ライセンスの下で提供されています。詳細は

LICENSE
ファイルをご確認ください。

同じ日のほかのニュース

一覧に戻る →

2026/06/01 7:59

Chuwi Minibook X:私たちが望むネットブック

## 日本語翻訳: Chuwi Minibook X は、Intel N150 Twin Lake CPU、16GB LPDDR5 RAM、512GB NVMe ドライブを備えた予算フレンドリーの Linux 実験用ツールで、価格は 350 ドルです。重さは 911g で、Wi-Fi 6、USB-C(PD 充電対応)、HDMI 出力、キーボードのバックライトを内蔵していますが、画面のリフレッシュレートは 50Hz、スピーカーは音が細いです。ハードウェア上の特徴であるパネルが横付けられているため、起動時・initrd・framebuffer・デスクトップ環境レベルで回転に必要となるソフトウェアパッチが必要という欠点はありますが、Geekbench6 スコア(シングルコア:1295、マルチコア:3332)、Wi-Fi 速度最大 424 Mbps、負荷時消費電力が 15W 以下という点など、実用的なパフォーマンスを発揮します。ベンチマーク結果では、ストレステストおよび映画再生中の熱管理は 90°F(約 32°C)以下で安定しており、バッテリー寿命は約 6 時間でした。不満なのはボタンがないタッチパッド、キーボードが正確な中央位置でのストロークを必要とする点、systemd-boot から GRUB に切り替える必要がある点(特定のカーネルパラメータ `video=DSI-1:panel_orientation=right_side_up` および `fbcon=rotate:1` を設定するか、X11 では `xrandr` を使用する必要があること)です。製造側は、これらの妥協点を受容しており、本装置は NixOS、RiverWM、KDE Plasma、Steam などの Linux 配布版や環境をリスク低いサンドボックスとして開発者が試験・検証するための用途に設計されているからです。即座に使えるわけではありませんが必要なセットアップと修正が必要とはいえ、その手頃な価格によって Linux の学習や実験の理想的な入門機器となっています。 ## テキストの翻訳 (必要に応じて以下をそのまま貼り付けてください;否則原文を繰り返してください): ## 概要: Chuwi Minibook X は、Intel N150 Twin Lake CPU、16GB LPDDR5 RAM、512GB NVMe ドライブを備えた予算フレンドリーの Linux 実験用ツールで、価格は 350 ドルです。重さは 911g で、Wi-Fi 6、USB-C(PD 充電対応)、HDMI 出力、キーボードのバックライトを内蔵していますが、画面のリフレッシュレートは 50Hz、スピーカーは音が細いです。ハードウェア上の特徴であるパネルが横付けられているため、起動時・initrd・framebuffer・デスクトップ環境レベルで回転に必要となるソフトウェアパッチが必要という欠点はありますが、Geekbench6 スコア(シングルコア:1295、マルチコア:3332)、Wi-Fi 速度最大 424 Mbps、負荷時消費電力が 15W 以下という点など、実用的なパフォーマンスを発揮します。ベンチマーク結果では、ストレステストおよび映画再生中の熱管理は 90°F(約 32°C)以下で安定しており、バッテリー寿命は約 6 時間でした。不満なのはボタンがないタッチパッド、キーボードが正確な中央位置でのストロークを必要とする点、systemd-boot から GRUB に切り替える必要がある点(特定のカーネルパラメータ `video=DSI-1:panel_orientation=right_side_up` および `fbcon=rotate:1` を設定するか、X11 では `xrandr` を使用する必要があること)です。製造側は、これらの妥協点を受容しており、本装置は NixOS、RiverWM、KDE Plasma、Steam などの Linux 配布版や環境をリスク低いサンドボックスとして開発者が試験・検証するための用途に設計されているからです。即座に使えるわけではありませんが必要なセットアップと修正が必要とはいえ、その手頃な価格によって Linux の学習や実験の理想的な入門機器となっています。

2026/05/31 23:13

指紋化可能な WebGL を必要とする Cloudflare Turnstile

## Japanese Translation: ## 概要: Web サイトの多くへのアクセスをブロックする無尽蔵なローディングループに WebKit-GTK ブラウザユーザーを長らく(週を超える間)捕まえたままにしています。これは、訪客を検証するために Cloudflare が WebGL データを要求するためですが、WebKit ブラウザは長年このフィンガープリンティングをブロックしており、その結果、Cloudflare のセキュリティプロトコルがsanitize された応答をボットのような行動と誤って識別しているためです。Mozilla Firefox 145.0 は、WebKit と異なる GPU 特性を返すことで無限ループを回避していますが、完全な制限のバイパスを妨げる厳格なプライバシー設定には依然として悩まされています。この状況は、ユーザーが匿名性を犠牲にするか、あるいはサイトから取り残されるかのジレンマを生み出しています。これは、長年にわたる正当なプライバシー対策と、誤ってこれらの保護を悪意のある活動と見なす過激なセキュリティチェックとの間の対立を示しています。(168 語)

2026/06/01 0:04

ローカルデバイス向けの 1 ビットボサイン画像生成モデル「4B Image Generation」

## Japanese Translation: Bonsai Image 4B は、FLUX.2 Klein 4B から派生したコンパクトな画像生成モデルファミリーであり、ラップトップからスマートフォンまでのローカルハードウェア上で高品質な拡散推論を可能にすることを目的としています。2 つのバリエーションを提供します: - 1 ビット Bonsai Image 4B は、{-1, +1} の二値変換器重みと FP16 グループ軸スケーリング(有効ビット数〜1.125 bits/weight)を採用し、拡散変換器のフットプリントを 8.3 倍に圧縮—from 7.75 GB to ~0.93 GB—and GenEval、HPSv3、DPG-Bench のベンチマークにおいて元のモデルの約 88% の精度を維持します。 - テルナリー Bonsai Image 4B は、{-1, 0, +1} のテルナリー重みと FP16 スケーリング(有効ビット数〜1.71 bits/weight)を採用し、フットプリントを 6.4 倍に圧縮—to ~1.21 GB—and 元の精度の約 95% を維持します。 512×512 の生成に対する総アクティブメモリは、フルプレシジョンの FLUX.2 Klein 4B の 11.74 GB に対して、それぞれ 1 ビットで約 1.5 GB、テルナリーで約 1.96 GB に減少します。特に、1 ビットのバリエーションはそのパラメータクラス初の iPhone(例:iPhone 17 Pro Max)上で直接動作する画像モデルであり、フルプレシジョンの FLUX.2 Klein 4B は同様に動作しません。パフォーマンスベンチマークでは、iPhone 17 Pro Max で 512×512 の生成に約 9.4 秒、Mac M4 Pro で約 6 秒となり、標準の MFLUX に比べて約 5.6 倍高速です。 両バリエーションとも Apache 2.0 ライセンスで公開され、重みとコードがオープン化されており、サーバーサイドリクエストなしでローカル推論を可能にします。Apple Silicon(iPhone、iPad、Mac)では MLX を用いて、CUDA GPU では Gemlite の低ビット GEMM カーネルを用いて動作し、新たにローンチされる Bonsai Studio iOS アプリと連携して提供されます。