
2026/02/06 1:13
**Show HN:** *Smooth CLI ― AIエージェント向けトークン効率の高いブラウザ*
RSS: https://news.ycombinator.com/rss
要約▶
Japanese Translation:
AI エージェント(例:Claude Code)はテキストベースの環境で優れていますが、Web ページを直接操作する際には制約があります。現在のブラウザツールは「クリック」「入力」「スクロール」など低レベルなアクションしか公開しておらず、エージェントはピクセル座標や UI ノイズを管理しなければならないため、実行が遅くトークン消費も大きく、無関係な UI イベントによるコンテキスト汚染が発生します。また、iframe や Shadow DOM など複雑なページ構造に対する専門性の不一致も問題です。
Smooth CLI は自然言語インターフェースを提供してこれらの課題を解決します。エージェントは「連絡先フォームに入力する」や「NYC から LA へのフライトを検索する」といった高レベルの目標だけを述べることができ、Smooth がその意図を必要なブラウザコマンドへ変換します。不要な UI 処理ステップを排除することでトークン使用量を削減し、タスク完了速度を向上させ、Web サイトをナビゲートする AI エージェントを構築する開発者や企業にとって信頼性が高まります。
本文
問題点
Claude Code のような AI エージェントは強力ですが、ほとんどがターミナルに閉じ込められています。一方で、最も価値のある作業はブラウザ上で行われます。
現在エージェント向けに提供されているブラウザツール(例:
--chrome、Playwright MCP、agent-browser)は同じ過ちを犯しています。すなわち、click・type・scroll などの低レベル操作をそのまま公開してしまうことです。このため、エージェントは「ボタンの位置」ではなく「実際に達成したいゴール」に集中できません。
これが三つの問題を引き起こします:
| 問題 | 重要性 |
|---|---|
| 遅くて高価 | ボタンをクリックするために大規模モデルを使うのは無駄です。各操作はトークンと時間を消費します。 |
| コンテキスト汚染 | クリックやキー入力が UI のノイズとしてコンテキストウィンドウを埋め、タスクが埋もれます。 |
| 専門性の欠如 | 汎用モデルは iframe やシャドウ DOM、ウェブサイトの混沌とした実態に対処するよう訓練されていません。 |
解決策
Smooth CLI は AI エージェント向けに設計されたブラウザです。数百もの低レベルツールを公開する代わりに、エージェントにシンプルな自然言語インタフェースを提供します。
- エージェントは「何がしたいか」を述べるだけ。
- Smooth がそれを実行方法を決定。
動作原理
以下のように細かく操作を指示する代わりに:
click(x=342, y=128) type("search query") click(x=401, y=130) scroll(down=500) click(x=220, y=340) ...(あと50ステップ)
エージェントは「NYC から LA へのフライトを検索し、最も安いオプションを見つけてください」とだけ言えば十分です。
エージェントはゴールに集中でき、Smooth がブラウザ操作を担います。
始めましょう