2026/03/17 0:25

Apideck CLI – MCP よりずっと低いコンテキスト消費で実現する AI エージェントインタフェース

RSS: https://news.ycombinator.com/rss

要約▶

Japanese Translation:

改訂要約

記事は、AI エージェントにとってコマンドラインインターフェース（CLI）が、トークン制限、信頼性、安全性が重要な場合、機械間プロトコル（MCP）よりも遥かに効率的で信頼できると主張しています。

主要証拠：
MCP ツール定義は 200,000 トークンの予算の約 143 k を消費し、会話に残るトークンがほとんどありません。各ツールは 550–1,400 トークンを必要とするため、大規模な API サーフェスはトークン上限の 50 % を超える可能性があります。

ベンチマークテスト（Scalekit の 75 回ランヘッド・ツー・ヘッド）では、MCP は CLI と同一タスクで 4–32 倍多くトークンを使用します（例：リポジトリ言語チェック：44 k 対 1.3 k）。
CLI は約 80 トークンと時折の
--help
呼び出し（合計約 400）しか必要とせず、MCP は初期に 10 k 以上を要求します。
MCP は TCP タイムアウトによる失敗率が高く（28%）、ローカル CLI バイナリはそのようなレイテンシや接続プールの枯渇を回避します。
対応策： 記事では 3 つの選択肢を提示しています：（1）圧縮テクニック付き MCP、（2）コード実行（Duet スタイル）、（3）CLI をエージェントインターフェースとして使用。各オプションが適切な場面—MCP はスコープの狭い高頻度ツールや OAuth 同意を必要とするステートフルワークフロー、CLI はトークン節約と構造的安全性をバイナリに組み込める汎用インタラクション時—を明確化しています。

構造的安全性： Apideck CLI はコード内で権限を強制します（例：GET は自動承認、POST/PUT/PATCH はプロンプト付き、DELETE は
--force
がないとブロック）。これにより、プロンプトインジェクションが安全規則を上書きするのを防ぎます。

API プロバイダーへの影響： OpenAPI スペックは軽量化し、段階的開示パターンを採用し、権限モデルをプロンプトではなくツールに直接埋め込み、機械向け JSON 出力をデフォルトで提供することが推奨されます。

将来展望： AI エージェントが API をより多く消費するにつれ、プロバイダーはトークン最適化、安全アーキテクチャ、および CLI 互換性に注力し、エージェントフレンドリーであり続ける必要があります。

本文

デモ規模で誰も語らない問題

「MCPサーバーをデモ以上の用途に組み込んだことがあるなら、ここで挙げるシナリオはすぐに覚えられるでしょう。」
GitHub、Slack、Sentry を連携… 55 000トークン分のツール定義がコンテキストウィンドウに入っています。Claude の 200k 制限の四分の一以上です。

トークン予算の膨張

アプローチ	最初のメッセージ前に消費されるトークン
コンテキスト内にフル OpenAPI スペックを入れる	30 000–100 000+
MCP ツール（各 API で約3 600）	10 000–50 000+
CLI エージェントプロンプト	~80
必要時の CLI `--help` 呼び出し	50–200

例：

MCP – 10 000 トークン以上を最初にロード、エージェントが使わなくても。
CLI – 会計クエリで三回の
```
--help
```
呼び出しだけで約400トークン。

同じ問題への３つのアプローチ

圧縮テクニックを併用した MCP
スキーマを圧縮、ツール検索、OpenAPI スペックを分割。
範囲が限定されたやり取りにはうまく機能するがインフラオーバーヘッドが増え、トークンコストは依然として課金される。
コード実行（Duet）
エージェントが SDK へコードを書き、実行し、スクリプトを保存。
長期稼働ワークスペースや複雑なワークフローに強力だが安全性の表面は大きく、サンドボックス化が不可欠。
CLI をエージェントインタフェースとして使用 (我々の選択)
洗練された CLI を提供し、
```
--help
```
で必要に応じて機能を発見。
トークン経済性が劇的に低く、信頼性も高い（リモートサーバータイムアウトなし）。

なぜ CLI が実用的なベストスポットなのか

プログレッシブディスロージャーでトークンを節約

apideck を使って Apideck Unified API と対話します。
利用可能な API: `apideck --list`
リソース一覧: `apideck <api> --list`
操作ヘルプ: `apideck <api> <resource> <verb> --help`
...

約80トークン をシステムプロンプトに使用。
各
```
--help
```
呼び出しは 50–200 トークンしか消費せず、必要時のみロード。

信頼性：ローカルがリモートを上回る

メトリクス	MCP	CLI
GitHub Copilot サーバーでの失敗率	28 % (7/25 実行)	0 %（バイナリはローカル実行）
月間コスト差額（10 000 オペレーション/月）	$55.20	$3.20

構造的安全性がプロンプトベースより優位

// internal/permission/engine.go
switch op.Permission {
case spec.PermissionRead:
    return ActionAllow      // GET → 自動承認
case spec.PermissionWrite:
    return ActionPrompt     // POST/PUT/PATCH → 確認必須
case spec.PermissionDangerous:
    return ActionBlock       // DELETE → デフォルトでブロック
}

プロンプトがこのロジックを上書きすることはない。
権限ポリシーは
```
~/.apideck-cli/permissions.yaml
```
でカスタマイズ可能。

汎用互換性、プロトコルオーバーヘッドゼロ

すべてのエージェントフレームワークに「シェルコマンド実行」というプリミティブがある。
MCP は専用クライアントサポートを必要とするが、CLI には

$PATH

にバイナリを置くだけで済む。

私たちの構築方法

起動時に最新 Apideck Unified API スペックを解析し、コマンドツリー全体をダイナミックに生成する単一の静的 Go バイナリ。

コード生成なし – スペックを埋め込み、
```
libopenapi
```
でパース。
賢い出力デフォルト – TTY ではない場合は JSON、対話型使用時は色付きテーブル。
認証は目に見えない – 環境変数 (
```
APIDECK_API_KEY
```
等) または設定ファイルから取得し、エージェントへ露出させず。
コネクタターゲティング –
```
--service-id
```
で特定の統合にアクセス。

CLI が解決できないケース

シナリオ	推奨アプローチ
範囲が限定され、頻繁に使われるツール（例：カスタマーサポート）	MCP（スキーマコストを amortize）
複雑で状態保持するワークフロー（polling, aggregation）	コード実行
他ユーザーの代理として動く（マルチテナント B2B）	MCP（ネイティブ OAuth & audit trail）

MCP の認証モデルはまだ追いついていない。多くのプロバイダーが Dynamic Client Registration をサポートしていない。

API プロバイダーへの示唆

OpenAPI スペックサイズに注意 – 50+ エンドポイントだと MCP のトークンオーバーヘッドがコンテキストウィンドウを超える可能性あり。
プログレッシブディスロージャー = トークン最適化 – 全てを一度に出すのではなく、段階的に機能を公開。
構造的安全性は譲れない – 権限モデルをコードで強制し、プロンプトには任せない。
マシン向け出力を提供 – 非対話型環境では JSON をデフォルトに、安定した終了コードを返す。

さらに読む

MCP vs API – How MCP and REST APIs relate (Apideck ブログ)
API Design Principles for the Agentic Era – Designing APIs with AI agents as first‑class consumers
Understanding the Security Landscape of MCP – MCP security considerations in depth
The MCP Context Tax – Detailed analysis of MCP token overhead
Agentic CLI Design: 7 Principles – Design principles for CLIs as agent interfaces
MCP vs CLI Benchmark – Scalekit's head‑to‑head benchmark data (75 runs, Claude Sonnet 4)

この記事は以上です。

同じ日のほかのニュース

一覧に戻る →

2026/03/17 5:59

MistralがLeanstralをリリース --- (※「Leanstral」はそのまま固有名詞として扱います。)

## Japanese Translation: --- ## Summary Leanstral は **Lean 4 専用に設計された最初のオープンソースコードエージェント** であり、Apache 2.0 ライセンスの下でリリースされ、重みファイルをダウンロードできるほか、一時的な無料 API エンドポイント（`labs-leanstral-2603`）と公開された技術レポートがあります。このモデルは **証明工学タスクに最適化された非常にスパースな 6 B‑パラメータアーキテクチャ** を採用し、Lean を完璧な検証器として活用した並列推論を実現しています。モデルは **lean‑lsp‑mcp データセット** 上で訓練されており、Mistral Vibe 経由で任意の Model‑Composed Pipelines（MCP）をサポートします。 **FLTEval** で評価すると—FLT プロジェクトにおける形式的証明の完了と新概念の定義をベンチマークし、単独の数学問題ではなく実際のタスクを測定する—Leanstral‑120B‑A6B は **pass@2 スコア 26.3 と pass@4 スコア 29.3** を達成し、GLM5‑744B‑A40B（≈16–20）や Kimi‑K2.5‑1T‑32B よりも優れた性能を示しています。Claude 系列モデルと比較すると、Leanstral は **$36 で pass@2 スコア 26.3** を達成し、Sonnet の $549（スコア 23.7）に対して同等の性能です。また **pass@16 スコア 31.9 が $531** で得られ、Sonnet の $8,031.9 と比較しても大幅に低価格です。Claude Opus 4.6 モデルは依然として最高品質ですが、$1,650 という価格は Leanstral の同等スコア時の費用の約 90 倍以上になります。実際のケーススタディでは、その実用性が示されています： * Lean 4.29.0‑rc6 の破壊的変更を診断し、`def` と `abbrev` 間の定義等価性問題を特定して正しい修正案を提示し、ユーザーに説明しました。 * Princeton の CS 441 コースから Rocq 定義を Lean に変換し、カスタム記法を扱い、証明が提供されていないプロパティも自動で証明しました。 Leanstral は **Mistral Vibe** に統合されており、ユーザーは `/leanstall` エンドポイントを呼び出してゼロセットアップのコーディングと証明を行えます。一時的な API エンドポイント（`labs-leanstral-2603`）はフィードバックと観測データ収集のために利用可能です。ユーザーはモデル重みをダウンロードし、Leanstral をローカルで実行したり、Mistral Vibe にサインアップして完全なドキュメントへアクセスすることもできます。この軽量かつコスト効果の高いツールは、開発者や研究者が形式的検証ワークフローを加速させるために活用でき、コミュニティへの貢献と学術界および産業界での広範な採用を促進します。

2026/03/17 3:12

Meta、jemallocへの再挑戦を強化

## Japanese Translation: ``` ## Summary Meta は、Linux カーネルや Meta のインフラストラクチャ内のコンパイラなど重要なコンポーネントを動かす高性能メモリアロケータである jemalloc に注力することを決定しました。この移行は長期的なメリットに基づいており、保守コストの削減、コードベースの近代化、および進捗を遅らせていた技術的負債の排除が目的です。今回の取り組みの一環として、オリジナルのオープンソース jemalloc リポジトリはアーカイブから外されました。主な改善領域は以下の通りです： - **技術的負債削減** – 効率と信頼性を向上させるためにクリーンアップとリファクタリングを実施。 - **Huge‑Page Allocator (HPA)** – CPU の効率化を図るためにトランスペアレントヒュージページ（THP）の使用を改善。 - **メモリ効率** – パッキング、キャッシュ、およびパージング機構の最適化。 - **AArch64 最適化** – ARM64 プラットフォームでのアウト・オブ・ザ・ボックス性能を確保。 Meta はオープンソースコミュニティに貢献を呼びかけ、jemalloc の将来ロードマップを共に形作ることによって、Meta 自身のソフトウェアユーザーとこのアロケータに依存する広範なエコシステム双方に利益をもたらすよう促しています。 ```

2026/03/17 2:17

小さなWebは、あなたが考えているよりもずっと大きいものです。

## 日本語訳: **概要** 本文は、**「小さなウェブ」― 通常のブラウザとサーバーでアクセスできる非営利・個人向けサイトが依然として膨大かつ活発だが、1 ページだけでまとめるにはあまりにも大きい」という事実を説明しています。** - **背景**：Gemini プロトコルは世界中に約 6,000 のカプセル（capsule）という独自のエコシステムを持ち、そのフォーラムには主に IT 専門家で構成される約 100 名が参加し、商業的利用は推奨していません。 - **手法**：著者は Kagi が公開する更新フィードを配信しているサイトのリストを使用しました。このリストは昨年の約 6,000 件から今日では約 32,000 件に増加し、多くはプライベートブログや企業がホストするサイト（例：Blogger）です。 - **フィルタリングプロセス** 1. 各フィードをダウンロードし、タイムスタンプと有効な XML があることを確認した結果、約 25,000 サイトに絞られました。 2. 月間更新が 1 回未満のサイトを除外すると、約 9,000 のアクティブサイトが残ります。 - **結果**：3 月 15 日時点でこれら 9,000 サイトは 1,251 件の更新（主に新しいコンテンツ追加）を生成し、過去の日付とほぼ同程度です。毎日の更新量を見ると、単一ページの集約は非実用的であり、小さなウェブはその規模と活発さからそのような表示には不向きです。 - **結論**：サイズが大きいにも関わらず、小さなウェブは成長を続け、主流プラットフォームに対する広告なしの代替手段として機能します。 - **行動喚起**：著者は読者に対し、このページへの参照 URL を含む Webmention を送信してもらい、継続的な関与を促しています。

**Apideck CLI – MCP よりずっと低いコンテキスト消費で実現する AI エージェントインタフェース**