Show HN:Claude、Codex、Cursor で直接スマートモデルルーティングを実行する

2026/06/27 1:40

Show HN:Claude、Codex、Cursor で直接スマートモデルルーティングを実行する

RSS: https://news.ycombinator.com/rss

要約

Japanese Translation:

Weave は、Avengers-Pro 1 クラスタースコアラーを基盤とした Drop-in プロキシルーターを発表しました。このシステムは、各リクエストに対して最適な AI モデルを自動的に選択し、開発者の人工知能との相互作用を簡素化します。システムは、Anthropic、OpenAI、Gemini などの主要なプロバイダーおよび、Llama、Qwen、Mistral、DeepSeek、Kimi、GLM など OpenRouter を通じてまたは OpenAI 互換エンドポイントを経由してアクセスできるオープンソースの大手モデルをサポートしています。Cursor、Claude Code、Codex、opencode などのツールへは、ローカルエンドポイント(デフォルト:

localhost:8080
)に接続するだけでシームレスにつながり、Docker コンテナ、データベース、複雑なセットアップを必要としません。インストールには Node.js ≥ 18 および特定のクライアント用の
jq
が要求され、カスタマイズ用のコマンドラインフラグ(
--claude
--codex
など)が用意されています。セルフホスティングには、
.env.local
OPENROUTER_API_KEY
を設定し、
make full-setup
を実行する必要があります。デフォルトでは、「Bring Your Own Key」(BYOK)のセキュリティが強制され、機密性のあるプロバイダー鍵はユーザーのローカルマシン上で暗号化されたまま保存され、認証には別ルのルーターベアートークンが使用されます。CLI コマンドやツール固有のスラッシュコマンドを通じて、ユーザーはスマートプロキシモードと直接接続を瞬時に切り替えられます。
localhost:8080/ui/
の可視性ダッシュボードを介して、ルティング決定を追跡する OTLP トレースを通じて深い可視性が提供されます(デフォルトパスワード:
admin
)。結局のところ、Weave は柔軟なコネクティビティと堅牢でデフォルトオンであるセキュリティ、そして完全なユーザー制御を組み合わせることで、ローカル AI デプロイメントの向上を実現しています。

本文

Weave Router:統一された LLM エンドポイントで、あらゆるモデルを最適なパフォーマンスへ

Anthropic、OpenAI、Gemini の 3 つの主要プラットフォームに対応するドロップイン式プロキシです。ご提示の各リクエストに対して、軽量なオンボックス埋め込みモデルを活用し、「雰囲気」ではなく客観的に最適なモデルを選定します。

Weave(開発元)は、エンジニアリング体験を向上させる No.1 のプラットフォームを提供しており、Robinhood、PostHog、Reducto などの有名企業でも採用されています。

🚀 機能概要

localhost:8080
にルーターを設定することで、以下の高度な機能が提供されます。

  • 🎯 リクエスト単位での動的ルーティング
    • Avengers-Pro 1 を基にしたクラスタースコアラーが、有効なプロバイダーの中から最適なモデルを各ターンで選定します。
  • 🔌 全 API プラットフォーム対応
    • Anthropic Messages、OpenAI Chat Completions、Gemini ネイティブ形式をすべてサポート。
    • ストリーミング、ツールの使用、ビジョン機能など、あらゆる機能をネイティブに実装しています。
  • 🧠 オープンソース(OSS)モデルの活用
    • OpenRouter または OpenAI 互換エンドポイントを介して、DeepSeek、Kimi、GLM、Qwen、Llama、Mistral などを利用可能です。
  • 🔒 セキュリティ優先の BYOK(Bring Your Own Key)
    • プロバイダーの API キーはお客様のサーバー内に留まり、ディスク上では暗号化された状態で保存されます。
  • 📊 可視化とモニタリング
    • インストール済み状態で OTLP トレースを即座に表示できます。
    • Weave ダッシュボード (
      http://localhost:8080/ui/dashboard
      ) の利用、または Honeycomb、Datadog、Grafana へのドロップインが可能。

⚡ 30 秒での快速起動

最も簡単な導入方法は、Claude Code、Codex、または opencode を既存の Weave ルーターに指向させることです。

  • ❌ クローン不要
  • ❌ Docker 不要
  • ❌ Postgres 不要

インストーラーが自動的に以下を行います:

  1. 使用ツール(Claude Code、Codex、opencode)の確認
  2. スコープ(ユーザーまたはプロジェクト)の設定
  3. ルーターキーの取得
  4. 設定ファイルの構築

コマンドラインオプション

必要に応じて、以下のコマンドで動作を変更できます。

# ツールごとの快速起動(ピッカーをスキップ)
npx @workweave/router --claude     # Claude Code を使用
npx @workweave/router --codex      # OpenAI Codex CLI を使用
npx @workweave/router --opencode   # opencode を使用

# スコープ設定
npx @workweave/router --scope project # リポジトリ単位で設定(settings.json など)

# セルフホストオプション
npx @workweave/router --local        # セルフホストの localhost:8080
npx @workweave/router --base-url https://router.acme.internal

# バージョン固定
npx @workweave/router@0.1.0 

🔧 要件: Node.js ≥ 18(Claude Code および opencode の場合は追加で

jq
も必要)。詳細は
install/npm/README.md
を参照してください。

🔋 スタック全体のセルフホスト

ルーターおよびダッシュボードを自社サーバー上で動かしたい場合、以下の手順で行います。

  1. プロバイダーキーの設定 推奨ベースラインは OpenRouter です。

    echo "OPENROUTER_API_KEY=sk-or-v1-..." >> .env.local
    
  2. Postgres とルーターの起動、認証トークン生成

    make full-setup
    

完了すると以下のサービスが起動します:

  • ルーター:
    http://localhost:8080
  • ダッシュボード:
    http://localhost:8080/ui/
    (デフォルトパスワード:
    admin
  • 認証トークン: ログ出力される
    rk_...
    がアクセストークンとなります。

🧪 API 呼び出し例

Anthropic 形式で呼び出す:

curl -sS http://localhost:8080/v1/messages \
  -H "Authorization: Bearer rk_..." \
  -d '{"model":"claude-sonnet-4-5","max_tokens":256, "messages":[{"role":"user","content":"hi"}]}'

OpenAI 形式で呼び出す:

curl -sS http://localhost:8080/v1/chat/completions \
  -H "Authorization: Bearer rk_..." \
  -d '{"model":"gpt-4o-mini", "messages":[{"role":"user","content":"hi"}]}'

ルーティング判断結果のみを取得:

curl -sS http://localhost:8080/v1/route -H "Authorization: Bearer rk_..." -d '...'

🛠️ ツールとの連携方法

各ツールへの設定方法を解説します。

Claude Code

  • ローカルセルフホスト:
    make install-cc
    を実行してください(
    make full-setup
    の終了時にも自動実行されます)。
  • ホストルーター: 前述の
    npx @workweave/router
    コマンドを使用します。

Codex (OpenAI CLI)

コマンドを実行することで、設定ファイルに

[model_providers.weave]
ブロックを追加・設定します。

# グローバルまたはプロジェクト単位で設定
npx @workweave/router --codex
  • Codex の既存の
    OPENAI_API_KEY
    は api.openai.com へのプランベースパススルーに使用されます。
  • ルーターキーはヘッダー
    X-Weave-Router-Key
    で送信されます。
  • 再インストール:
    --uninstall --codex
    を使うことで、管理ブロックのみを書き換えたり削除したりし、他の設定は破損しません。

opencode

npx @workweave/router --opencode
  • opencode 内蔵の @ai-sdk/anthropic プロバイダーを利用し、ルーターの
    /v1
    エンドポイントに指向します。
  • ルーターは Anthropic Messages API をネイティブ理解するため、特別な設定なしで動作します。
  • ルーターキーとアイデンティティヘッダーをプロバイダー設定とともに送信します。

Cursor (ベータ)

※パフォーマンス最適化中(一部制約あり)。

  1. Settings → Models → Override OpenAI Base URL を
    http://localhost:8080/v1
    に設定。
  2. API キーに
    rk_...
    を貼り付けます。

🔄 オン/オフ切り替え

インストール後、必要に応じて個別のクライアントをプロバイダーに直接ルーティングに戻す(ルーター設定は保持)ことができます。

# クライアント別への切り替え(再度プロバイダー直通へ戻す)
npx @workweave/router off --claude
npx @workweave/router off --codex
npx @workweave/router off --opencode

# 元に戻す(On)
npx @workweave/router on --claude

現在のステータスの確認:

  • スラッシュコマンド: Claude Code 向けに
    /router-off
    /router-on
    /router-status
    が用意されています。
  • Cursor: 設定画面から切り替え可能です。 詳細は
    install/README.md
    を参照してください。

⚠️ キーの混同にご注意

以下の 2 つのキーを必ず区別してください。

キー形式用途保存先
sk-or-...
/
sk-ant-...
/
sk-...
アップストリームプロバイダー(OpenAI/Anthropic など)のキー
.env.local
rk_...
ルーター認証トークン (Bearer Token)クライアントヘッダーに送信

📋 エンドポイント一覧

HTTP メソッドエンドポイント対応フォーマット / 機能
POST
/v1/messages
Anthropic Messages、ルーティング済み
POST
/v1/chat/completions
OpenAI Chat Completions、ルーティング済み
POST
/v1beta/models/:action
Gemini generateContent、ルーティング済み
POST
/v1/route
決定結果のみを返す(アップストリーム呼び出しなし)
GET
/
POST
/v1/models
·
/v1/messages/count_tokens
Anthropic パススルー
GET
/health
ライブネスチェック
GET
/validate
キー認証確認

📚 詳細ドキュメント

さらに深い情報については以下のドキュメントを参照してください。

  • 📐 構成リファレンス: すべての環境変数、BYOK 暗号化設定、OTel スイッチ、クラスタールーティングの詳細。
  • 🛠️ コントリビュートガイド: レイヤリング規則、ホットリロード開発、マイグレーション、テスト手法など。
  • 🏗️ アーキテクチャ: パッケージ構造、インポート契約、新規エンドポイント/プロバイダー/戦略の追加レシピ。

📖 参考論文・研究

Zhang, Y. et al. 「GPT-5 以降:パフォーマンス効率最適化によるルーティング(Avengers-Pro)を通じた LLM の低コスト化と性能向上」
arXiv:2508.12631, 2025.
https://arxiv.org/abs/2508.12631

同じ日のほかのニュース

一覧に戻る →

2026/06/27 2:06

次世代モデル「GPT‑5.6 Sol」の事前公開

## Japanese Translation: OpenAI は、GPT-5.6 シリーズの限定プレビューを発表しました。本シリーズには、以下の 3 つの専用モデルが含まれます:Sol(最も堅牢な安全スタックを備えたフラグシップモデル)、Terra(バランス型/コストパフォーマンス型)、Luna(高速型/最低コスト型)。リリースでは、高リスク向けアプリケーションにおけるセキュリティと論理処理に重点を置き、Terminal-Bench 2.1 でコーディングに関する業界最高水準のベンチマークを設定し、GeneBench v1 でゲノム解析分野でも同様に最良の結果を示しました。Sol モデルは特筆すべき点として、「ultra mode」を搭載しており、サブエージェントを活用して複雑なタスクの処理を加速させるとともに、ExploitBench² において優れた結果を達成しています(同時に自律的に全チェーンエクスプロイトを生産することには達しておらず、すなわち Cyber Critical の閾値を越えていません)。Sol は 70 万以上の GPU タイムに及ぶ自動化および人間によるレッドチーム検証を通じて開発され、リアルタイムクラシファイアやアカウントレベルでの審査など、多層的なサファガードスタックを有しています。一般公開前には、アクセスは信頼されたパートナーと米政府関係者に限られ、7 月に専用 Cerebras ハードウェア上で選定顧客向けに展開される予定です。利用者からはキャッシュ読み取りに対する大幅な割引を通じてコスト削減を提供する差別化された価格設定層が提供されますが、初期段階ではフル API アクセスには制限があります。結果として、このリリースは高い機能性と厳格な安全プロトコル、そして明確なパフォーマンス・コストバリエーションを両立させた責任ある AI 導入のための新たな業界基準を確立しました。

2026/06/27 12:30

ワードスター:作家のためのワープロソフト(1996)

## Japanese Translation: Robert J. Sawyer は、確立されたフィクション作家が現代のデジタル時代においても 1978 年のテキストエディタ「WordStar」を使い続けることを情熱的に提唱している。Microsoft Word に代表される現代的なワープロソフトは派手なグラフィックや複雑なメニューを提供するが、執筆モードと編集モードの間でユーザーが精神的にギアを切り替えることを強制し、創造性を阻害することがしばしばある。これに対し、WordStar の安定したクラッシュフリーな環境は、深みのある創造的フローにとって不可欠な妨げのない空間を提供する。このソフトウェアは効率的な「コントロールキー」インターフェースに依存し、物理的な「手書きの頁」を模倣することで、作家が認知的不中断のまま自由にナビゲートすることを可能にしている。そのエルゴノミクス設計はプロのタッチタイピストを支え、カスタマイズ性はユーザーに適応させるため而非公式なワークフローを変えることを求める。このアプローチは、アーサー・C・クラークやジョージ・R・R・マーティンといった伝説的な作家からの称賛を得ており、彼らは新機能よりも安定性を重視している。現代的なアプリケーションによる精神的疲労を避けることで、本物の作家は草稿と作品の精査の間で流体様なる連続性を維持でき、古典的な技術が専門家のサイエンスファンタジー書きの要件に独特に適していることを示している。 ## Text to translate: Robert J. Sawyer passionately argues that established fiction authors should continue using WordStar, a robust text editor from 1978, even in the modern digital age. While contemporary word processors like Microsoft Word offer flashy graphics and complex menus, they often disrupt creativity by forcing users to switch mental gears between writing and editing modes. In contrast, WordStar's stable, crash-free environment provides a distraction-free space essential for deep creative flow. The software relies on an efficient "Control-key" interface and mimics a physical "long-hand page," allowing writers to navigate freely without cognitive interruption. Its ergonomic design supports professional touch typists, and its customizability adapts to the user rather than demanding they change their workflow. This approach has earned praise from legendary authors like Arthur C. Clarke and George R.R. Martin, who value stability over new features. By avoiding the mental fatigue of modern applications, serious writers can maintain a fluid continuum between drafting and refining their work, proving that classic technology remains uniquely suited for the demands of professional science fiction writing.

2026/06/25 13:06

旧ハードウェアでの Linux 運用:完全リバイバルガイド

## Japanese Translation: Linux ディストリビューションは、TPM 2.0 や低容量 RAM など過時硬件要件による電子廃棄物を解決する、Windows 11 の代替手段として有効な選択肢を提供します。Windows 11 はアイドル状態でも 3〜4GB のメモリで起動可能ですが、軽量オプションは遥かに少ない消費量を実現します。例えば、Xfce を使用した Ubuntu は約 650MB を、antiX(約 256MB)や Puppy Linux などの超軽量ディストリビューションは最低 256MB のマシンでも動作可能です。リソースが限られているユーザーには、2GB より少ない RAM のシステムには antiX が推奨され、2〜4GB の場合では Lubuntu(アイドル時約 480MB)、4GB 以上のマシンでは Linux Lite(アイドル時約 650MB)が適しています。なお、BunsenLabs Carbon などがサポートを終了する 2026 年 2 月には、古くからの 32 ビットハードウェアは互換性問題に直面します。 適切な OS を選ぶだけでなく、戦略的なアップグレードと調整により性能を大幅に向上させることも可能です。機械式ハードドライブを SATA SSD に置き換えることで、起動時間を 45 秒以上から 18 秒未満に短縮できます。上級ユーザーは診断のために `free -h`、`lscpu`、`lsblk` などのコマンドを使用し、zram 圧縮を有効化して RAM 容量を増大させるようにシミュレートし、swappiness 設定を 10 に下げて古いドライブへの磨耗を軽減し、不要なサービス(例:bluetooth、cups)を無効化し、キャッシュの無効化や広告ブロッカーを活用してブラウザのメモリ使用量を最適化するなどの措置应采取します。これらのステップにより、高価な新ハードウェア購入なしでレガシーマシンも効果的に動作させることが可能になります。