
2026/06/27 1:40
Show HN:Claude、Codex、Cursor で直接スマートモデルルーティングを実行する
RSS: https://news.ycombinator.com/rss
要約▶
Japanese Translation:
Weave は、Avengers-Pro 1 クラスタースコアラーを基盤とした Drop-in プロキシルーターを発表しました。このシステムは、各リクエストに対して最適な AI モデルを自動的に選択し、開発者の人工知能との相互作用を簡素化します。システムは、Anthropic、OpenAI、Gemini などの主要なプロバイダーおよび、Llama、Qwen、Mistral、DeepSeek、Kimi、GLM など OpenRouter を通じてまたは OpenAI 互換エンドポイントを経由してアクセスできるオープンソースの大手モデルをサポートしています。Cursor、Claude Code、Codex、opencode などのツールへは、ローカルエンドポイント(デフォルト:
localhost:8080)に接続するだけでシームレスにつながり、Docker コンテナ、データベース、複雑なセットアップを必要としません。インストールには Node.js ≥ 18 および特定のクライアント用の jq が要求され、カスタマイズ用のコマンドラインフラグ(--claude、--codex など)が用意されています。セルフホスティングには、.env.local に OPENROUTER_API_KEY を設定し、make full-setup を実行する必要があります。デフォルトでは、「Bring Your Own Key」(BYOK)のセキュリティが強制され、機密性のあるプロバイダー鍵はユーザーのローカルマシン上で暗号化されたまま保存され、認証には別ルのルーターベアートークンが使用されます。CLI コマンドやツール固有のスラッシュコマンドを通じて、ユーザーはスマートプロキシモードと直接接続を瞬時に切り替えられます。localhost:8080/ui/ の可視性ダッシュボードを介して、ルティング決定を追跡する OTLP トレースを通じて深い可視性が提供されます(デフォルトパスワード:admin)。結局のところ、Weave は柔軟なコネクティビティと堅牢でデフォルトオンであるセキュリティ、そして完全なユーザー制御を組み合わせることで、ローカル AI デプロイメントの向上を実現しています。本文
Weave Router:統一された LLM エンドポイントで、あらゆるモデルを最適なパフォーマンスへ
Anthropic、OpenAI、Gemini の 3 つの主要プラットフォームに対応するドロップイン式プロキシです。ご提示の各リクエストに対して、軽量なオンボックス埋め込みモデルを活用し、「雰囲気」ではなく客観的に最適なモデルを選定します。
Weave(開発元)は、エンジニアリング体験を向上させる No.1 のプラットフォームを提供しており、Robinhood、PostHog、Reducto などの有名企業でも採用されています。
🚀 機能概要
localhost:8080 にルーターを設定することで、以下の高度な機能が提供されます。
- 🎯 リクエスト単位での動的ルーティング
- Avengers-Pro 1 を基にしたクラスタースコアラーが、有効なプロバイダーの中から最適なモデルを各ターンで選定します。
- 🔌 全 API プラットフォーム対応
- Anthropic Messages、OpenAI Chat Completions、Gemini ネイティブ形式をすべてサポート。
- ストリーミング、ツールの使用、ビジョン機能など、あらゆる機能をネイティブに実装しています。
- 🧠 オープンソース(OSS)モデルの活用
- OpenRouter または OpenAI 互換エンドポイントを介して、DeepSeek、Kimi、GLM、Qwen、Llama、Mistral などを利用可能です。
- 🔒 セキュリティ優先の BYOK(Bring Your Own Key)
- プロバイダーの API キーはお客様のサーバー内に留まり、ディスク上では暗号化された状態で保存されます。
- 📊 可視化とモニタリング
- インストール済み状態で OTLP トレースを即座に表示できます。
- Weave ダッシュボード (
) の利用、または Honeycomb、Datadog、Grafana へのドロップインが可能。http://localhost:8080/ui/dashboard
⚡ 30 秒での快速起動
最も簡単な導入方法は、Claude Code、Codex、または opencode を既存の Weave ルーターに指向させることです。
- ❌ クローン不要
- ❌ Docker 不要
- ❌ Postgres 不要
インストーラーが自動的に以下を行います:
- 使用ツール(Claude Code、Codex、opencode)の確認
- スコープ(ユーザーまたはプロジェクト)の設定
- ルーターキーの取得
- 設定ファイルの構築
コマンドラインオプション
必要に応じて、以下のコマンドで動作を変更できます。
# ツールごとの快速起動(ピッカーをスキップ) npx @workweave/router --claude # Claude Code を使用 npx @workweave/router --codex # OpenAI Codex CLI を使用 npx @workweave/router --opencode # opencode を使用 # スコープ設定 npx @workweave/router --scope project # リポジトリ単位で設定(settings.json など) # セルフホストオプション npx @workweave/router --local # セルフホストの localhost:8080 npx @workweave/router --base-url https://router.acme.internal # バージョン固定 npx @workweave/router@0.1.0
🔧 要件: Node.js ≥ 18(Claude Code および opencode の場合は追加で
jq も必要)。詳細は install/npm/README.md を参照してください。
🔋 スタック全体のセルフホスト
ルーターおよびダッシュボードを自社サーバー上で動かしたい場合、以下の手順で行います。
-
プロバイダーキーの設定 推奨ベースラインは OpenRouter です。
echo "OPENROUTER_API_KEY=sk-or-v1-..." >> .env.local -
Postgres とルーターの起動、認証トークン生成
make full-setup
完了すると以下のサービスが起動します:
- ルーター:
http://localhost:8080 - ダッシュボード:
(デフォルトパスワード:http://localhost:8080/ui/
)admin - 認証トークン: ログ出力される
がアクセストークンとなります。rk_...
🧪 API 呼び出し例
Anthropic 形式で呼び出す:
curl -sS http://localhost:8080/v1/messages \ -H "Authorization: Bearer rk_..." \ -d '{"model":"claude-sonnet-4-5","max_tokens":256, "messages":[{"role":"user","content":"hi"}]}'
OpenAI 形式で呼び出す:
curl -sS http://localhost:8080/v1/chat/completions \ -H "Authorization: Bearer rk_..." \ -d '{"model":"gpt-4o-mini", "messages":[{"role":"user","content":"hi"}]}'
ルーティング判断結果のみを取得:
curl -sS http://localhost:8080/v1/route -H "Authorization: Bearer rk_..." -d '...'
🛠️ ツールとの連携方法
各ツールへの設定方法を解説します。
Claude Code
- ローカルセルフホスト:
を実行してください(make install-cc
の終了時にも自動実行されます)。make full-setup - ホストルーター: 前述の
コマンドを使用します。npx @workweave/router
Codex (OpenAI CLI)
コマンドを実行することで、設定ファイルに
[model_providers.weave] ブロックを追加・設定します。
# グローバルまたはプロジェクト単位で設定 npx @workweave/router --codex
- Codex の既存の
は api.openai.com へのプランベースパススルーに使用されます。OPENAI_API_KEY - ルーターキーはヘッダー
で送信されます。X-Weave-Router-Key - 再インストール:
を使うことで、管理ブロックのみを書き換えたり削除したりし、他の設定は破損しません。--uninstall --codex
opencode
npx @workweave/router --opencode
- opencode 内蔵の @ai-sdk/anthropic プロバイダーを利用し、ルーターの
エンドポイントに指向します。/v1 - ルーターは Anthropic Messages API をネイティブ理解するため、特別な設定なしで動作します。
- ルーターキーとアイデンティティヘッダーをプロバイダー設定とともに送信します。
Cursor (ベータ)
※パフォーマンス最適化中(一部制約あり)。
- Settings → Models → Override OpenAI Base URL を
に設定。http://localhost:8080/v1 - API キーに
を貼り付けます。rk_...
🔄 オン/オフ切り替え
インストール後、必要に応じて個別のクライアントをプロバイダーに直接ルーティングに戻す(ルーター設定は保持)ことができます。
# クライアント別への切り替え(再度プロバイダー直通へ戻す) npx @workweave/router off --claude npx @workweave/router off --codex npx @workweave/router off --opencode # 元に戻す(On) npx @workweave/router on --claude
現在のステータスの確認:
- スラッシュコマンド: Claude Code 向けに
、/router-off
、/router-on
が用意されています。/router-status - Cursor: 設定画面から切り替え可能です。
詳細は
を参照してください。install/README.md
⚠️ キーの混同にご注意
以下の 2 つのキーを必ず区別してください。
| キー形式 | 用途 | 保存先 |
|---|---|---|
/ / | アップストリームプロバイダー(OpenAI/Anthropic など)のキー | |
| ルーター認証トークン (Bearer Token) | クライアントヘッダーに送信 |
📋 エンドポイント一覧
| HTTP メソッド | エンドポイント | 対応フォーマット / 機能 |
|---|---|---|
| | Anthropic Messages、ルーティング済み |
| | OpenAI Chat Completions、ルーティング済み |
| | Gemini generateContent、ルーティング済み |
| | 決定結果のみを返す(アップストリーム呼び出しなし) |
/ | · | Anthropic パススルー |
| | ライブネスチェック |
| | キー認証確認 |
📚 詳細ドキュメント
さらに深い情報については以下のドキュメントを参照してください。
- 📐 構成リファレンス: すべての環境変数、BYOK 暗号化設定、OTel スイッチ、クラスタールーティングの詳細。
- 🛠️ コントリビュートガイド: レイヤリング規則、ホットリロード開発、マイグレーション、テスト手法など。
- 🏗️ アーキテクチャ: パッケージ構造、インポート契約、新規エンドポイント/プロバイダー/戦略の追加レシピ。
📖 参考論文・研究
Zhang, Y. et al. 「GPT-5 以降:パフォーマンス効率最適化によるルーティング(Avengers-Pro)を通じた LLM の低コスト化と性能向上」
arXiv:2508.12631, 2025.
https://arxiv.org/abs/2508.12631