
2026/04/05 17:56
「洞窟人:数個のトークンで十分なのに、いくつも使う理由は何でしょうか?」
RSS: https://news.ycombinator.com/rss
要約▶
Japanese Translation:
概要:
「Caveman」Claude スキルは、出力トークン使用量を約 75% 削減しつつ、完全な技術的正確性を保つ軽量プラグインです。通常の Claude 応答から語尾の付け言葉、冠詞、挨拶、曖昧さや不要な冗長表現を除去しますが、技術用語、正確なエラーメッセージ、コードブロック、および Git コミットテキストはそのまま保持されます。トークン節約率は 22 %〜87 %で、平均して約 65 %です。2026 年 3 月の研究(「Brevity Constraints Reverse Performance Hierarchies in Language Models」)では、より簡潔な回答がベンチマーク精度を約 26 パーセントポイント向上させることが示されています。Caveman は内部推論や思考トークンは変更せず、最終的な出力トークン数のみを削減します。このツールは MIT ライセンスでオープンソース化されており、Julius Brussee のエコシステム(「Blueprint」や「Revu」と並ぶ)に含まれます。インストールは簡単です:を実行するか Claude マーケットプレイスを使用し、次にnpx skills add JuliusBrussee/caveman、/caveman、または音声コマンドで有効化します。「stop caveman」で停止できます。ユーザーは約 3 倍速い応答、71 %のトークンコスト削減、および読みやすくクリーンな説明を期待でき、詳細を犠牲にすることなく実現できます。この効率向上は、Claude を技術サポート、ドキュメント作成、迅速プロトタイピングに利用している開発者や企業にとって価値があります。$caveman
本文
なぜ少数のトークンで十分なのに、多く使うの?
インストール • ベンチマーク • 以前/以後 • 理由
Claude Code のスキル/プラグインと Codex プラグインで、エージェントを「洞窟人語」で話させる—トークン数を約 75 % 削減しつつ、完全に技術的正確性を保持。
洞窟人語は LLM のトークン使用量を劇的に減らすことが広く観測されており、私たちはこれをワンライナーのインストールへ落とし込みました。
以前 / 以後
| 通常 Claude (69 トークン) | 洞窟人 Claude (19 トークン) | |
|---|---|---|
| React 再描画説明 | 「あなたの React コンポーネントが再描画される理由は、各レンダリングサイクルで新しいオブジェクト参照を作成しているためです。インラインオブジェクトをプロップに渡すと、React の浅い比較が毎回別物として検知し、再描画をトリガーします。 でオブジェクトをメモ化することを推奨します。」 | 「新しいオブジェクト参照毎レンダリング。インラインオブジェクトプロップ = 新参照 = 再描画。useMemo で包む。」 |
| Auth ミドルウェア修正 | 「もちろんです!お手伝いできることを嬉しく思います。現在直面している問題は、認証ミドルウェアがトークンの有効期限を適切に検証していないためだと思われます。確認して解決策をご提案します。」 | 「Auth ミドルウェアバグ。 ではなく を使うべき。修正:…」 |
同じ修正、75 % 短縮。脳は大きいまま。
ベンチマーク
Claude API の実際のトークン数(自分で再現可):
| タスク | 通常 (トークン) | 洞窟人 (トークン) | 削減 |
|---|---|---|---|
| React 再描画バグ説明 | 1180 | 159 | 87 % |
| Auth ミドルウェア期限修正 | 704 | 121 | 83 % |
| PostgreSQL 接続プール設定 | 2347 | 380 | 84 % |
| git rebase vs merge 解説 | 702 | 292 | 58 % |
| コールバックを async/await にリファクタリング | 387 | 301 | 22 % |
| マイクロサービス vs モノリス アーキテクチャ | 446 | 310 | 30 % |
| PR のセキュリティレビュー | 678 | 398 | 41 % |
| Docker マルチステージビルド | 1042 | 290 | 72 % |
| PostgreSQL ランクコンディションデバッグ | 1200 | 232 | 81 % |
| React エラーバウンダリ実装 | 3454 | 456 | 87 % |
平均: 1214 → 294 トークン(65 % 削減)。
レンジ: 22 %–87 %。
洞窟人は出力トークンのみを短縮。推論トークンは変わらず、脳は同じままです。ただ口だけが小さくなるので速度とコストに効果があります。
科学的根拠
2026年3月の論文 “Brevity Constraints Reverse Performance Hierarchies in Language Models” では、モデルを短い回答に制限すると特定ベンチマークで精度が 26 ポイント向上し、性能階層を逆転させることが示されました。冗長は必ずしも良いわけではなく、少ない語数=より正確になるケースがあります。
インストール
npx skills add JuliusBrussee/caveman
または Claude Code プラグインシステム経由:
claude plugin marketplace add JuliusBrussee/caveman claude plugin install caveman@caveman
Codex 用: リポジトリをクローンし、Codex で開き
/plugins を実行。 “Caveman” を検索してインストール。
一度だけの設定で以降すべてのセッションに適用可能です。岩一本で完了。
使用方法
以下で起動:
または/cavemanCodex $caveman"talk like caveman""caveman mode""less tokens please"
停止時:
"stop caveman" または "normal mode"。
洞窟人がすること
| 事項 | 洞窟人の対応 |
|---|---|
| 英語説明 | フィラーを削除 |
| コードブロック | 通常通り (不適切なものはなし) |
| 技術用語 | 正確に保持(例: polymorphism はそのまま) |
| エラーメッセージ | 文字通り引用 |
| Git コミット & PR | 通常通り記述 |
| 冠詞 (“a, an, the”) | 削除 |
| 挨拶 | 削除(例: “Sure I’d be happy to” は消える) |
| 保留表現 | 削除(例: “It might be worth considering” は extinct) |
理由
┌─────────────────────────────────────┐ │ TOKENS SAVED ████████ 75% │ │ TECHNICAL ACCURACY ████████ 100%│ │ SPEED INCREASE ████████ ~3x │ │ VIBES ████████ OOG │ └─────────────────────────────────────┘
- 高速応答: 生成トークンが少ないため、処理速度向上。
- 読みやすさ: テキストの壁ではなく、答えだけを提示。
- 同等の精度: 技術情報は保持し、余分な語は削除(科学的根拠あり)。
- コスト節約: 約 71 % の出力トークン削減で費用低減。
- 楽しさ: コードレビューがコミカルに変わります。
仕組み
洞窟人は「愚か」ではなく「効率的」です。通常の LLM は次のようなフレーズでトークンを浪費します:
- “I’d be happy to help you with that” (8 トークン)
- “The reason this is happening is because” (7 トークン)
- “I would recommend that you consider” (7 トークン)
- “Sure, let me take a look at that for you” (10 トークン)
洞窟人は必要なことだけを語り、そこで止まります。
リポジトリに星付け
洞窟人で大量のトークンとお金が節約できるなら、星をつけてください。⭐
他プロジェクト
- Blueprint — Claude Code 用仕様駆動開発:自然言語 → ブループリント → 並列ビルド → 実働ソフトウェア。
- Revu — macOS 専用のローカル第一学習アプリ、FSRS spaced repetition、デッキ・試験・スタディガイド (revu.cards)。
ライセンス
MIT – 大草原で自由に走る大猛獣のように。