
2026/04/12 14:45
3 月 6 日、Anthropic はキャッシュの有効期限(TTL)を下げています。
RSS: https://news.ycombinator.com/rss
要約▶
Japanese Translation:
Anthropic は、2026 年 3 月上旬に Claude Code のデフォルトのプロンプトキャッシュ TTL を 1 時間から 5 分に変更したと報告されており、その結果として著しい運営上の回帰が起きた。2026 年 1 月から 4 月にかけての 119,000 件以上の API 呼び出しへのデータ分析により、前回の 1 時間の設定が一定期間(2 月 1 日から 3 月 5 日まで)意図的な標準として機能していたことが示され、より安価な 5 分制のティアの使用はゼロであった。3 月末頃に行われた 5 分制への切り替えはコスト構造を根本的に変化させ、従来コスト効果の高い「一時停止して再開する」というワークフローを、安価な読み込みではなく高価な書き込み操作に強制するに至った。この変更により、Sonnet および Opus モデルに対して約 2,500 米ドル分の不要な超過課金が生じ(おおよそ 17% の浪費)、以前よりも頻繁な利用実績があったにもかかわらず、ユーザーが初めて小時間のトークン割当数に達した。1 月のデータではティアの可用性が限られているため変動が大きかったものの、2 月から 3 月上旬までの具体的な行動タイムラインは、システム構成が変更されるまでは 1 時間のデフォルト設定が機能していたことを確認している。したがって、開発者たちはトークン計数に関する規則に対する透明性の確保を求めていますとともに、そのような破壊的な変更を防ぐために 1 時間制のデフォルトを回復するか、またはユーザーが設定可能なオプションを提供するよう緊急に要求している。
本文
要約
2026 年 1 月 11 日から 4 月 11 日にかけての生な Claude Code セッション JSONL ファイルを分析した結果、Anthropic が 2026 年 3 月上旬のある時点で、プロンプトキャッシュの TTL(有効期限)のデフォルト設定を静かに 1 時間から 5 分に変更した迹象があることを示しています。この変更以前には、Claude Code は意図されたデフォルトであると考えられる 1 時間の TTL キャッシュ書き込みを受けていました。TTL の 5 分にの回帰により、キャッシュ作成コストは 20%〜32% 増加し、これまでクォータ制限に達した経験がなかったサブスクリプションユーザーにおいて、明確なクォータ消費量の急増が確認されました。これは #45756 で記述された挙動と直接的に関連していると考えられます。
データ
2026 年 1 月 11 日から 4 月 11 日までの期間における、2 台の異なるマシン(Linux ワークステーションおよび Windows ノートパソコン)の
~/.claude/projects/ ディレクトリにある JSONL ファイルから抽出したセッションデータを含みます。これらは 2 つの異なるアカウント・セッションに対応しており、合計 119,866 回の API 呼び出しを記録しています。各アシスタントメッセージには、usage.cache_creation.ephemeral_5m_input_tokens / ephemeral_1h_input_tokens という分解情報が含まれており、これにより呼び出しあたりの TTL タイアが可視化されています。2 台の独立したマシンでデータを取得している点が強力な証拠となります――両方のマシンともに、同じ時期に同様の振る舞いの変化を示しています。
フェーズごとの分析
| フェーズ | 期間 | TTL の挙動 | 根拠 |
|---|---|---|---|
| 1 | 2026-01-11 ~ 01-31 | 5 分のみ | が欠落・ゼロである。これは API で 1 時間タイアが利用可能になる以前の状態である可能性が高い |
| 2 | 2026-02-01 ~ 03-05 | 1 時間のみ | 両マシンで連続して 33 日以上にわたり、=0 および >0 を示す(例外はほぼゼロ) |
| 3 | 2026-03-06 ~ 07 | トランジション中 | 5 分のトークンが初めて再出現し、量は少ない一方、1 時間は依然存在 |
| 4 | 2026-03-08 ~ 04-11 | 5 分が優勢 | 5 分のトークン数が急増して多数派を占め、1 時間側のものが少数派になったり完全に消えたりする |
フェーズ 2 が Anthropic の意図したデフォルト振る舞いを表していると考えられます。1 時間の TTL は 2026 年 2 月 1 日頃の Claude Code スタンダードとして導入され、その後約 1 ヶ月にわたり、2 つの異なるアカウントを持つ独立した 2 台のマシンで一貫して維持されました。1 月の全 5 分データの状況は、おそらく API で 1 時間 TTL タイアが利用可能になる前の期間を反映しているものと推測されます。回帰現象は 2026 年 3 月 6 日〜8 日頃に発生しました。
フェーズ間のクライアント側の設定変更はありませんでした。 Claude Code のバージョンや使用方法も一貫して維持されていました。TTL タイアは Anthropic によってサーバー側で設定されます。
日ごとの TTL データ(回帰を示すもの)※両マシンの統合データ
| 日付 | 5 分作成トークン数 | 1 時間作成トークン数 | 挙動 |
|---|---|---|---|
| 2026-02-01 | 0.00M | 1.70M | 1 時間のみ ← 1 時間デフォルト開始 |
| 2026-02-09 | 0.00M | 7.95M | 1 時間のみ |
| 2026-02-15 | 0.00M | 13.61M | 1 時間のみ ← 最も重い日で、100% が 1 時間 |
| 2026-02-28 | 0.00M | 16.15M | 1 時間のみ ← 1,600 万トークンで依然として 100% が 1 時間 |
| 2026-03-01 | 0.00M | 0.12M | 1 時間のみ |
| 2026-03-04 | 0.00M | 8.12M | 1 時間のみ |
| 2026-03-05 | 0.00M | 6.55M | 1 時間のみ ← 最後のクリーンな 1 時間単独の日 |
| 2026-03-06 | 0.29M | 0.22M | 混合 ← 5 分トークンの再出現 |
| 2026-03-07 | 4.56M | 0.50M | 混合 ← 5 分の急増 |
| 2026-03-08 | 16.86M | 3.44M | 混合 ← 5 分が優勢 (83%) |
| 2026-03-10 | 10.55M | 0.51M | 混合 |
| 2026-03-15 | 19.47M | 1.84M | 混合 |
| 2026-03-21 | 21.37M | 1.70M | 混合 ← 5 分が 93% を占める |
| 2026-03-22 | 13.48M | 2.85M | 混合 |
この移行は日単位で明確に見て取れます。3 月 6 日は、33 日間続いたクリーンな 1 時間単独の振る舞いの後に、5 分トーク数が初めて再出現した時点です。3 月 8 日には、5 分トークンの数が 1 時間トークンの数の約 5 倍になりました。これは、サーバー側の設定変更が段階的に展開され、その後 3 月 8 日頃に完了したことを示しています。
コストへの影響
公式の Anthropic 価格体系(2026 年 4 月 9 日更新の
rates.json)を適用した場合:
合計データセット(119,866 回の API 呼び出し、2 台のマシン)
価格設定:
(cache_write_5m = $3.75/MTok、cache_write_1h = $6.00/MTok、cache_read = $0.30/MTok)claude-sonnet-4-6
| 月 | 呼び出し回数 | 実際のコスト | 1 時間 TTL を使用した場合の想定コスト | 過払い額 | 浪費率 |
|---|---|---|---|---|---|
| 2026-01 | 2,639 | $78.99 | $37.54 | $41.45 | 52.5% |
| 2026-02 | 27,220 | $1,120.43 | $1,108.11 | $12.32 | 1.1% ← ほぼゼロ(1 時間支配) |
| 2026-03 | 68,264 | $2,776.11 | $2,057.01 | $719.09 | 25.9% |
| 2026-04 | 21,743 | $1,193.01 | $1,016.78 | $176.23 | 14.8% |
| 合計 | 119,866 | $5,561.17 | $4,612.09 | $949.08 | 17.1% |
*
(cache_write_5m = $6.25/MTok、cache_write_1h = $10.00/MTok、cache_read = $0.50/MTok)claude-opus-4-6
| 月 | 呼び出し回数 | 実際のコスト | 1 時間 TTL を使用した場合の想定コスト | 過払い額 | 浪費率 |
|---|---|---|---|---|---|
| 2026-01 | 2,639 | $131.65 | $62.57 | $69.08 | 52.5% |
| 2026-02 | 27,220 | $1,867.38 | $1,846.85 | $20.53 | 1.1% ← ほぼゼロ(1 時間支配) |
| 2026-03 | 68,264 | $4,626.84 | $3,428.36 | $1,198.49 | 25.9% |
| 2026-04 | 21,743 | $1,988.35 | $1,694.64 | $293.71 | 14.8% |
| 合計 | 119,866 | $9,268.97 | $7,687.17 | $1,581.80 | 17.1% |
Anthropic が 1 時間 TTL をデフォルトとして採用していた 2 月では、浪費率はわずか 1.1%(片方のマシンの 1 日のみでわずかな 5 分アクティビティが残存)であり、他のすべての月は 15%〜53% の過払いが発生しています。このコストの違いは完全に TTL タイアによるものであり、使用量とは無関係です。モデルティア間で浪費率(17.1%)が同一なのは、トークン単価ではなく、5 分と 1 時間のトークンの分割比率によって駆動されているためです。
なぜ 5 分 TTL は実際には非常に高額なのか
5 分 TTL の場合、セッション内で 5 分以上の停止が生じるだけで、すべてのキャッシュされたコンテキストが有効期限を迎えます。次のターンでは、Claude Code はそのコンテキストを新鮮な
cache_creation として書き込みレートで再アップロードする必要がある一方、読み込みレートでの cache_read として利用することはできません。Sonnet では書き込みレートは読み込みレートの約 12.5 倍高く、Opus でも同様の比率が成立します。長期間にわたるコーディングセッション――Claude Code の主要なユースケースである場合――これは複合的なペナルティを生み出します:セッションが長くなり複雑になるほど、キャッシュされるコンテキストの量が大きくなり、かつそのキャッシュの有効期限切れるたびに発生するコストが高くなるのです。
分析対象の 3 ヶ月間にわたり:
- 2 億 2,000 万トークンが 5 分タイアに書き込まれた
- その同じトークン群は、57 億回のキャッシュ読み込みを生成した(つまり活発に使用されていた)
- もしそれらの 2 億 2,000 万トークンが 1 時間タイアであった場合、同一時間内での再アクセスは書き込みではなく、読み込み($0.30〜0.50/MTok)として処理されたであろう
クォータへの影響
Pro またはサブスクリプションプランを利用するユーザーは、コスト制限だけでなく、クォータ制限も設けられています。キャッシュ作成トークンは全額がクォータにカウントされますが、キャッシュ読み込みトークンは著しく低価格(正確な係数は #45756 で調査中)です。3 月に静かに 5 分 TTL に回帰したことが、2026 年 3 月以前にはクォータ制限に到達したことのなかった本件の報告者を含むサブスクリプションユーザーが初めて 5 時間のクォータ制限にぶつかる理由の最も可能性が高い説明です。
仮説
データは強く示唆しており、1 時間 TTL が Claude Code の意図されたデフォルトであり、2026 年 2 月上旬から存在していたと考えられます。2026 年 2 月 27 日から 3 月 8 日の間のどこかで、Anthropic はデフォルトを静かに 5 分 TTL に変更しました――意図的なコスト削減対策としてのものか、あるいはインフラストラクチャ上の回帰事故としての可能性があります。
「1 時間が意図されたデフォルトだった」とを示す根拠
- フェーズ 2(1 時間のみ)は、3 週間以上にわたる 14 つの異なるアクティブな日をまたがって、ゼロ個の 5 分トークンを示しています。これはノイズや部分的な展開ではなく、一貫した意図的な振る舞いです。
- 2 月のコストプロファイルは過払いが 0% の唯一の月であり、ユーザーがかつて支払うべきだった正当な費用を表しています。
- 3 月の回帰は直ちに、データセット全体で最大の 5 分タイアの日にち(単に 3 月 22 日だけで 3,000 万トークン)を生み出しており、これは緩やかな漂いではなく、突発的な設定の切り替えを示唆しています。
- サブスクリプションユーザーは初めて 3 月に 5 時間のクォータ制限に直面し、これは回帰現象と完全に一致しています。
最も可能性のある事象の順序:
- ~2026 年 2 月 1 日以前:Anthropic は Claude Code のサブスクリプションユーザーに対して 1 時間 TTL をデフォルトとして採用していた。
- ~2026 年 3 月 6 日:5 分トークンの再出現が始まる――設定変更の段階的な展開、またはインフラストラクチャの部分的な切り替え。
- ~2026 年 3 月 8 日:5 分 TTL が優勢に――回帰現象はテストされた両方のマシンとアカウントで完全に効力に達する。
- 3 月 8 日以降:混合的な振る舞いが継続し、展開の不完全さ、A/B テスト、または地域別のインフラ変動を示唆している。
クリーンな 1 時間単独の振る舞いの 33 日間(2026 年 2 月 1 日~3 月 5 日)は、2 つの独立したマシンと 2 つの異なるアカウントにまたがって観察されたものであり、1 時間 TTL が Anthropic の意図的なデフォルトだったという最も強力なシグナルの一つです。
要望事項
- Anthropic が 2026 年 2 月上旬にサーバーサイドで TTL デフォルトを変更し、2026 年 3 月上旬に戻したかどうかを確認・否定するよう求める。
- Claude Code セッションの意図された TTL 振る舞いを明確にする必要があります――5 分が意図されたデフォルトなのか、それとも 1 時間こそが恒久的なデフォルトだったのか?
- Claude Code セッションにおいて 1 時間 TTL をデフォルトに戻すか、あるいはユーザーが設定可能なオプションとして exposed することを検討するよう求める。5 分 TTL は、Claude Code の使用法を定義づける長時間のセッションかつ高コンテキストというユースケースにとって、不釣り合いに厳しい罰則となっています。
トークンのクォータカウント振る舞いについて開示するよう要請します(参照:[BUG] プロマックスプランでの 1.5 時間で通常の使用量にもかかわらずクォータを枯渇 #45756)。これにより、ユーザーは自身の使用パターンについて十分な情報を得て意思決定を行うことができるようになります。cache_read
研究方法
- 情報源: 生の
セッションファイル(Claude Code はメッセージごとの API レスポンス、包括的な usage オブジェクトを含めて保存します)。~/.claude/projects/**/*.jsonl - 抽出方法:
エントリーをフィルタリングし、type: "assistant"
フィールドが含まれているものを抽出。message.usage.cache_creation - 外部ツール: 使用なし――このデータは Claude Code 自身のセッションログから直接取得されています。
- 分析ツールの概要:
(本調査を支援するために追加)。cnighswonger/claude-code-cache-fix quota-analysis --source mode - 価格設定: 公式の Anthropic レート(2026 年 4 月 9 日更新の
から取得)。rates.json