3 月 6 日、Anthropic はキャッシュの有効期限(TTL)を下げています。

2026/04/12 14:45

3 月 6 日、Anthropic はキャッシュの有効期限(TTL)を下げています。

RSS: https://news.ycombinator.com/rss

要約

Japanese Translation:

Anthropic は、2026 年 3 月上旬に Claude Code のデフォルトのプロンプトキャッシュ TTL を 1 時間から 5 分に変更したと報告されており、その結果として著しい運営上の回帰が起きた。2026 年 1 月から 4 月にかけての 119,000 件以上の API 呼び出しへのデータ分析により、前回の 1 時間の設定が一定期間(2 月 1 日から 3 月 5 日まで)意図的な標準として機能していたことが示され、より安価な 5 分制のティアの使用はゼロであった。3 月末頃に行われた 5 分制への切り替えはコスト構造を根本的に変化させ、従来コスト効果の高い「一時停止して再開する」というワークフローを、安価な読み込みではなく高価な書き込み操作に強制するに至った。この変更により、Sonnet および Opus モデルに対して約 2,500 米ドル分の不要な超過課金が生じ(おおよそ 17% の浪費)、以前よりも頻繁な利用実績があったにもかかわらず、ユーザーが初めて小時間のトークン割当数に達した。1 月のデータではティアの可用性が限られているため変動が大きかったものの、2 月から 3 月上旬までの具体的な行動タイムラインは、システム構成が変更されるまでは 1 時間のデフォルト設定が機能していたことを確認している。したがって、開発者たちはトークン計数に関する規則に対する透明性の確保を求めていますとともに、そのような破壊的な変更を防ぐために 1 時間制のデフォルトを回復するか、またはユーザーが設定可能なオプションを提供するよう緊急に要求している。

本文

要約
2026 年 1 月 11 日から 4 月 11 日にかけての生な Claude Code セッション JSONL ファイルを分析した結果、Anthropic が 2026 年 3 月上旬のある時点で、プロンプトキャッシュの TTL(有効期限)のデフォルト設定を静かに 1 時間から 5 分に変更した迹象があることを示しています。この変更以前には、Claude Code は意図されたデフォルトであると考えられる 1 時間の TTL キャッシュ書き込みを受けていました。TTL の 5 分にの回帰により、キャッシュ作成コストは 20%〜32% 増加し、これまでクォータ制限に達した経験がなかったサブスクリプションユーザーにおいて、明確なクォータ消費量の急増が確認されました。これは #45756 で記述された挙動と直接的に関連していると考えられます。

データ
2026 年 1 月 11 日から 4 月 11 日までの期間における、2 台の異なるマシン(Linux ワークステーションおよび Windows ノートパソコン)の

~/.claude/projects/
ディレクトリにある JSONL ファイルから抽出したセッションデータを含みます。これらは 2 つの異なるアカウント・セッションに対応しており、合計 119,866 回の API 呼び出しを記録しています。各アシスタントメッセージには、
usage.cache_creation.ephemeral_5m_input_tokens / ephemeral_1h_input_tokens
という分解情報が含まれており、これにより呼び出しあたりの TTL タイアが可視化されています。2 台の独立したマシンでデータを取得している点が強力な証拠となります――両方のマシンともに、同じ時期に同様の振る舞いの変化を示しています。

フェーズごとの分析

フェーズ期間TTL の挙動根拠
12026-01-11 ~ 01-315 分のみ
ephemeral_1h
が欠落・ゼロである。これは API で 1 時間タイアが利用可能になる以前の状態である可能性が高い
22026-02-01 ~ 03-051 時間のみ両マシンで連続して 33 日以上にわたり、
ephemeral_5m
=0 および
ephemeral_1h
>0 を示す(例外はほぼゼロ)
32026-03-06 ~ 07トランジション中5 分のトークンが初めて再出現し、量は少ない一方、1 時間は依然存在
42026-03-08 ~ 04-115 分が優勢5 分のトークン数が急増して多数派を占め、1 時間側のものが少数派になったり完全に消えたりする

フェーズ 2 が Anthropic の意図したデフォルト振る舞いを表していると考えられます。1 時間の TTL は 2026 年 2 月 1 日頃の Claude Code スタンダードとして導入され、その後約 1 ヶ月にわたり、2 つの異なるアカウントを持つ独立した 2 台のマシンで一貫して維持されました。1 月の全 5 分データの状況は、おそらく API で 1 時間 TTL タイアが利用可能になる前の期間を反映しているものと推測されます。回帰現象は 2026 年 3 月 6 日〜8 日頃に発生しました。
フェーズ間のクライアント側の設定変更はありませんでした。 Claude Code のバージョンや使用方法も一貫して維持されていました。TTL タイアは Anthropic によってサーバー側で設定されます。

日ごとの TTL データ(回帰を示すもの)※両マシンの統合データ

日付5 分作成トークン数1 時間作成トークン数挙動
2026-02-010.00M1.70M1 時間のみ ← 1 時間デフォルト開始
2026-02-090.00M7.95M1 時間のみ
2026-02-150.00M13.61M1 時間のみ ← 最も重い日で、100% が 1 時間
2026-02-280.00M16.15M1 時間のみ ← 1,600 万トークンで依然として 100% が 1 時間
2026-03-010.00M0.12M1 時間のみ
2026-03-040.00M8.12M1 時間のみ
2026-03-050.00M6.55M1 時間のみ ← 最後のクリーンな 1 時間単独の日
2026-03-060.29M0.22M混合 ← 5 分トークンの再出現
2026-03-074.56M0.50M混合 ← 5 分の急増
2026-03-0816.86M3.44M混合 ← 5 分が優勢 (83%)
2026-03-1010.55M0.51M混合
2026-03-1519.47M1.84M混合
2026-03-2121.37M1.70M混合 ← 5 分が 93% を占める
2026-03-2213.48M2.85M混合

この移行は日単位で明確に見て取れます。3 月 6 日は、33 日間続いたクリーンな 1 時間単独の振る舞いの後に、5 分トーク数が初めて再出現した時点です。3 月 8 日には、5 分トークンの数が 1 時間トークンの数の約 5 倍になりました。これは、サーバー側の設定変更が段階的に展開され、その後 3 月 8 日頃に完了したことを示しています。

コストへの影響
公式の Anthropic 価格体系(2026 年 4 月 9 日更新の

rates.json
)を適用した場合:

合計データセット(119,866 回の API 呼び出し、2 台のマシン)
価格設定:

claude-sonnet-4-6
(cache_write_5m = $3.75/MTok、cache_write_1h = $6.00/MTok、cache_read = $0.30/MTok)

呼び出し回数実際のコスト1 時間 TTL を使用した場合の想定コスト過払い額浪費率
2026-012,639$78.99$37.54$41.4552.5%
2026-0227,220$1,120.43$1,108.11$12.321.1% ← ほぼゼロ(1 時間支配)
2026-0368,264$2,776.11$2,057.01$719.0925.9%
2026-0421,743$1,193.01$1,016.78$176.2314.8%
合計119,866$5,561.17$4,612.09$949.0817.1%

*

claude-opus-4-6
(cache_write_5m = $6.25/MTok、cache_write_1h = $10.00/MTok、cache_read = $0.50/MTok)

呼び出し回数実際のコスト1 時間 TTL を使用した場合の想定コスト過払い額浪費率
2026-012,639$131.65$62.57$69.0852.5%
2026-0227,220$1,867.38$1,846.85$20.531.1% ← ほぼゼロ(1 時間支配)
2026-0368,264$4,626.84$3,428.36$1,198.4925.9%
2026-0421,743$1,988.35$1,694.64$293.7114.8%
合計119,866$9,268.97$7,687.17$1,581.8017.1%

Anthropic が 1 時間 TTL をデフォルトとして採用していた 2 月では、浪費率はわずか 1.1%(片方のマシンの 1 日のみでわずかな 5 分アクティビティが残存)であり、他のすべての月は 15%〜53% の過払いが発生しています。このコストの違いは完全に TTL タイアによるものであり、使用量とは無関係です。モデルティア間で浪費率(17.1%)が同一なのは、トークン単価ではなく、5 分と 1 時間のトークンの分割比率によって駆動されているためです。

なぜ 5 分 TTL は実際には非常に高額なのか
5 分 TTL の場合、セッション内で 5 分以上の停止が生じるだけで、すべてのキャッシュされたコンテキストが有効期限を迎えます。次のターンでは、Claude Code はそのコンテキストを新鮮な

cache_creation
として書き込みレートで再アップロードする必要がある一方、読み込みレートでの
cache_read
として利用することはできません。Sonnet では書き込みレートは読み込みレートの約 12.5 倍高く、Opus でも同様の比率が成立します。
長期間にわたるコーディングセッション――Claude Code の主要なユースケースである場合――これは複合的なペナルティを生み出します:セッションが長くなり複雑になるほど、キャッシュされるコンテキストの量が大きくなり、かつそのキャッシュの有効期限切れるたびに発生するコストが高くなるのです。

分析対象の 3 ヶ月間にわたり:

  • 2 億 2,000 万トークンが 5 分タイアに書き込まれた
  • その同じトークン群は、57 億回のキャッシュ読み込みを生成した(つまり活発に使用されていた)
  • もしそれらの 2 億 2,000 万トークンが 1 時間タイアであった場合、同一時間内での再アクセスは書き込みではなく、読み込み($0.30〜0.50/MTok)として処理されたであろう

クォータへの影響
Pro またはサブスクリプションプランを利用するユーザーは、コスト制限だけでなく、クォータ制限も設けられています。キャッシュ作成トークンは全額がクォータにカウントされますが、キャッシュ読み込みトークンは著しく低価格(正確な係数は #45756 で調査中)です。3 月に静かに 5 分 TTL に回帰したことが、2026 年 3 月以前にはクォータ制限に到達したことのなかった本件の報告者を含むサブスクリプションユーザーが初めて 5 時間のクォータ制限にぶつかる理由の最も可能性が高い説明です。

仮説
データは強く示唆しており、1 時間 TTL が Claude Code の意図されたデフォルトであり、2026 年 2 月上旬から存在していたと考えられます。2026 年 2 月 27 日から 3 月 8 日の間のどこかで、Anthropic はデフォルトを静かに 5 分 TTL に変更しました――意図的なコスト削減対策としてのものか、あるいはインフラストラクチャ上の回帰事故としての可能性があります。

「1 時間が意図されたデフォルトだった」とを示す根拠

  • フェーズ 2(1 時間のみ)は、3 週間以上にわたる 14 つの異なるアクティブな日をまたがって、ゼロ個の 5 分トークンを示しています。これはノイズや部分的な展開ではなく、一貫した意図的な振る舞いです。
  • 2 月のコストプロファイルは過払いが 0% の唯一の月であり、ユーザーがかつて支払うべきだった正当な費用を表しています。
  • 3 月の回帰は直ちに、データセット全体で最大の 5 分タイアの日にち(単に 3 月 22 日だけで 3,000 万トークン)を生み出しており、これは緩やかな漂いではなく、突発的な設定の切り替えを示唆しています。
  • サブスクリプションユーザーは初めて 3 月に 5 時間のクォータ制限に直面し、これは回帰現象と完全に一致しています。

最も可能性のある事象の順序:

  • ~2026 年 2 月 1 日以前:Anthropic は Claude Code のサブスクリプションユーザーに対して 1 時間 TTL をデフォルトとして採用していた。
  • ~2026 年 3 月 6 日:5 分トークンの再出現が始まる――設定変更の段階的な展開、またはインフラストラクチャの部分的な切り替え。
  • ~2026 年 3 月 8 日:5 分 TTL が優勢に――回帰現象はテストされた両方のマシンとアカウントで完全に効力に達する。
  • 3 月 8 日以降:混合的な振る舞いが継続し、展開の不完全さ、A/B テスト、または地域別のインフラ変動を示唆している。

クリーンな 1 時間単独の振る舞いの 33 日間(2026 年 2 月 1 日~3 月 5 日)は、2 つの独立したマシンと 2 つの異なるアカウントにまたがって観察されたものであり、1 時間 TTL が Anthropic の意図的なデフォルトだったという最も強力なシグナルの一つです。

要望事項

  • Anthropic が 2026 年 2 月上旬にサーバーサイドで TTL デフォルトを変更し、2026 年 3 月上旬に戻したかどうかを確認・否定するよう求める。
  • Claude Code セッションの意図された TTL 振る舞いを明確にする必要があります――5 分が意図されたデフォルトなのか、それとも 1 時間こそが恒久的なデフォルトだったのか?
  • Claude Code セッションにおいて 1 時間 TTL をデフォルトに戻すか、あるいはユーザーが設定可能なオプションとして exposed することを検討するよう求める。5 分 TTL は、Claude Code の使用法を定義づける長時間のセッションかつ高コンテキストというユースケースにとって、不釣り合いに厳しい罰則となっています。
  • cache_read
    トークンのクォータカウント振る舞いについて開示するよう要請します(参照:[BUG] プロマックスプランでの 1.5 時間で通常の使用量にもかかわらずクォータを枯渇 #45756)。これにより、ユーザーは自身の使用パターンについて十分な情報を得て意思決定を行うことができるようになります。

研究方法

  • 情報源: 生の
    ~/.claude/projects/**/*.jsonl
    セッションファイル(Claude Code はメッセージごとの API レスポンス、包括的な usage オブジェクトを含めて保存します)。
  • 抽出方法:
    type: "assistant"
    エントリーをフィルタリングし、
    message.usage.cache_creation
    フィールドが含まれているものを抽出。
  • 外部ツール: 使用なし――このデータは Claude Code 自身のセッションログから直接取得されています。
  • 分析ツールの概要:
    cnighswonger/claude-code-cache-fix quota-analysis --source mode
    (本調査を支援するために追加)。
  • 価格設定: 公式の Anthropic レート(2026 年 4 月 9 日更新の
    rates.json
    から取得)。

同じ日のほかのニュース

一覧に戻る →

2026/04/13 4:44

怠惰と失われた危機の罠

## Japanese Translation: テキストは、ラリー・ウォールのプログラミングにおける「怠け」、不満、そして大それた振る舞いの美徳が依然として不可欠であると論じつつ、特に未来の利用に最適化された単純かつ強力な抽象化を駆使する「怠け」においてはその重要性が高いと指摘しています。これに対して、大規模言語モデル(LLM)は危険に「徳ある怠け」を、「 Hustle Porn」と呼ばれる偽の勤勉で置き換えてしまいました。人間とは異なり、LLM は作業に対してコストを負担せず、時間制約も無視するため、自慢のためのメトリクスによってではなくエンジニアリングの厳密さによってではない、不要なコードの層を蓄積します。この転換は、「Camel Book」という歴史的智慧において、即時の出力量よりも使いやすさを重視する方針と対照付けられます。具体例として、LLM を用いて 1 日 37,000 行ものコードを書き上げたというブロプログラマの Garry Tan の自慢に対し、Gregorein の分析によって多数のテストハネスとゼロバイトのロゴが示されており、これは無制約な AI が肥大化したシステムを生成する様子を明らかにしています。もし無制約のままにされれば、LLM は「ゴミ」の層を積み重ねることで単純な設計ではなく技術的負債の形で未来の世代を脅かすことになります。しかし、業界の行方はエンジニアがこれらの AI モデルを徳ある怠けの方へ導けるかに依存しています。制約と Oxide ガイドラインに導かれ、LLM が複雑性を削減し、厳密な設計を促進して将来に向けてより単純かつ強力なソフトウェア抽象化をもたらすことを保証することが可能です。 ## Text to translate: The text argues that while Larry Wall's programming virtues of laziness, impatience, and hubris remain essential—especially laziness, which drives simple, powerful abstractions optimized for future use—Large Language Models (LLMs) have dangerously displaced "virtuous laziness" with a form of false industry called "hustle porn." Unlike humans, LLMs incur no cost for work and ignore time constraints, causing them to accumulate unnecessary code layers driven by vanity metrics rather than engineering rigor. The summary contrasts this shift with historical wisdom found in the "Camel Book," which prioritizes ease of use over immediate output volume. Examples include broprogrammer Garry Tan bragging about writing thirty-seven thousand lines of code per day with LLMs, while Gregorein's analysis revealed multiple test harnesses and a zero-byte logo, illustrating how unchecked AI generates bloated systems. If left unconstrained, LLMs will threaten future generations with technical debt by building up "garbage" layers rather than simpler designs. However, the industry's trajectory depends on whether engineers can steer these AI models back toward serving virtuous laziness; guided by constraints and Oxide guidelines, we can ensure LLMs reduce complexity and promote rigorous design to yield simpler and more powerful software abstractions for the future.

2026/04/12 21:21

慣用表現に基づくデザインを取り戻そう

## Japanese Translation: 現代の Web アプリケーションは、デスクトップ時代の統一的なインターフェース標準を捨てて、基本的なタスクを第一原理から再発明し、リアルタイムコラボレーションなどの機能に優先順位を置いている。この変化により、ユーザーはチェックボックスによるログイン永続化や標準的なクレジットカード入力フィールドといった馴染み深い「デザイン慣習」に頼るのではなく、新たな相互作用パターンを絶えず学ぶことを余儀なくされている。Figma や Linear などのツールは設計が良くても、共有アイコンやキーボードショートカットの欠如により断片的な体験をもたらしており、OS によって強制されたライブラリによる予測可能な動作を保証した Windows 時代の均質なインターフェースとは対照的である。この増大するユーザー摩擦に対処するためには、HTML と CSS で定義されるコアなブラウザ慣習に回帰すべきであり、開発者はあいまいなアイコンよりも一貫したアクション、信頼できるデフォルト値、明瞭なテキストラベルを優先することで、予測可能性を取り戻し、ユーザーの学習時間を短縮し、UI 標準の全面的な再発明なしにも Web エコシステムへの信頼を再構築できる。

2026/04/13 1:38

# DIY ソフトドリンクの作り方 「DIY ソフトドリンク」というタイトルは適切ですが、コンテンツをさらに充実させるための構成案をご提案します。 ご自身の手に入れた素材や好みの味に合わせて自由にアレンジしてみてください。 --- ## 【必要なもの】 * 炭酸水(またはレモンサワーベースのシロップ) * シュガーシロップ(または蜂蜜、アガベシロップなど) * お好みの果実(レモン、ライム、オレンジなど) * 氷 * ガラス瓶またはペットボトル(中性洗剤で十分に洗浄したものですこと) ## 【基本レシピ】 1. **シロップの調製** 砂糖と水(甘さを抑えたい場合は 2:1 の割合、通常は 1:1)を鍋に入れて、弱火で溶かします。 お好みの果実を加えて香りを出したら、冷まします。 2. **果汁の絞り方** 新鮮な果実をよく洗い、果汁を搾ります。 必要であれば、果肉も一緒に漉すなどして、澄んだ液体に仕上げてください。 3. **混ぜ合わせ** シロップと果汁をお好みの比率で混合します(例:シロップ 2 :果汁 1)。 グラスや容器に移し替えて、冷蔵庫で保存してください。 4. **炭酸水とのミックス** 氷を入れたグラスに、少量の自家製果汁シロップを入れてから、炭酸水を注ぎます。 スパチュラなどで軽く混ぜ合わせれば完成です。 ## 【ポイント】 * 甘さは控えめが基本ですが、お好みで砂糖の量を調整してください。 * 新鮮な果実を使うことで、より自然な香りを堪能できます。 * 保存期間は冷蔵庫に置いても 2〜3 日が目安です。

## Japanese Translation: 本稿は、糖分・カフェインフリーで正確な自家製コーラレシピを開発する革新的なプロジェクトを記録しています。2020 年以降、著者は Open Cola や Cube Cola などのブランドに着想を得て、オレンジ、ライム、レモン、ナツメグ、シナモン(クサヤ)、コリアンダー、ラベンダーといったエッセンシャルオイルとアラビアゴム(天然の乳化剤)を主成分とする配合を開発しました。計測には 1 ml のインシュリンペン用シリンジを用い、科学的手法で精細な定量を実現しました。安全性も重視し、刺激性のあるエッセンシャルオイルを扱う際にはラテックス手袋を着用するなどの対策講行了されました。レシピは個人のかぶれやすさや感度に合わせて調整され、カフェインが省略され、クエン酸と人工甘味料(当初はナトリウムシклаマートとサッカリンで 1:8 の希釈比、後に「Syntez-Cola」バージョンではスクラロースとバニリン)を使用しています。一部のロットでは若干の苦みが残る事例もありました。さらに、血橙、ライム、アーモンド油によるアルモンド風味のドリンク(マザパンのようなニュアンスを持つものも)などの追加作品も作成されました。実用的な課題として、ハンドミキサー由来のプラスチックのカスを濾し取ることや、ガラス製または金属製の容器の利用が検討されました。著者は自家製コーラをデカフェ Coca-Cola より優れていると評価しており、「味が薄い」と述べています。レシピバージョンは記録されており(例:blinry orange 0.1.1、blinry almond 0.1.1 など)、2026 年には Open Soda のウェブサイトが閉鎖された後、プロジェクトは新ブログと Git リポジトリを通じた詳細な変更ログやバージョニングされた配合を公開する透明性の高いデジタルリソースへと進化しました。このイニシアチブは、趣味家のための再現性のあるレシピや、ダイエットに意識的な消費者のための高度な炭酸飲料(スーパーマーケットの標準品にはない独自の風味プロファイルを備えたもの)を提供します。