
2026/04/24 23:31
Show HN: ブラウザハーネス(Harness)—— 大規模言語モデル(LLM)にあらゆるブラウザタスクを完遂する自由を賦与します。
RSS: https://news.ycombinator.com/rss
要約▶
Japanese Translation:
このブレイクスルーでは、CDP(Chrome DevTools Protocol)上に直接構築された自己修復機能を持つ最も薄いハーネスが導入され、Large Language Models(LLM)にブラウザのあらゆるタスクを完了させるための完全な自由度を提供します。エージェントは helpers.py 内でタスク途中で欠落している機能を記述でき、例えばファイルアップロードを可能にするために helpers.py を 192 行から 199 行へと編集する例があります。セットアップは簡単です:Claude Code または Codex に「Set up https://github.com/browser-use/browser-harness for me」という指示を貼り付け、その後 browser connection については install.md、usage については SKILL.md、available functions については helpers.py を読むというフローに従ってください。接続後、検証ページのチェックボックスにチェックを入れてアクセス許可を与えます。無料プランでは cloud.browser-use.com/new-api-key にてカードの登録なしで 3 つの同時実行可能なリモートブラウザ、プロキシ、Captcha の解決が利用可能であり、LLM は docs.browser-use.com/llms.txt を介して API キーの登録を自律的に行うことができます。このプロジェクトは約 592 行のコンパクトな Python セットアップ(run.py で約 36 行、helpers.py で約 195 行、admin.py と daemon.py で約 361 行)です。スキルファイルを手作りで作成するのではなく、LinkedIn や Amazon など特定のサイト向けに domain-skills/ 下にカスタムドメインスキルの貢献が推奨され、github/、linkedin/、amazon/ の既存の例を参照してください。ハーネスはエージェントがタスク実行中に明らかな選択条件(selector)、フロー、またはエッジケースを発見した際に自動的に新しいドメインスキルを生成します。ドメインスキル、バグ修正、ドキュメントの微調整のための PR などの貢献は歓迎され、複雑なワークフローの手作りによる必要性を減らしつつ、プルリクエストと自動的なスキル生成によって駆動される進化へと業界を転換させていきます。
本文
最もシンプルで薄く、自己修復機能を備えたハーネスであり、LLM がブラウザのあらゆるタスクを完全に自由に実行できるようにするものです。CDP(Chrome DevTools Protocol)に直接構築されています。エージェントはタスクの途中で欠けているコードを書き込みます。フレームワークなし、レシピなし、レールなし。クロームへの接続は単一の WebSocket で、その間に何も介在しません。
- エージェント: ファイルをアップロードしたい
→Helpers.py
が欠落していることに気づくupload_file()- エージェントがハーネスを編集し、コードを
に書き込む(192 行から 199 行へ)helpers.py
を追加+ upload_file()
- ファイルがアップロードされました
これにより、ブラウザを使用する必要がなくなります。
セットアップのプロンプト Claud Code または Codex に貼り付けてください:
https://github.com/browser-use/browser-harness のためのセットアップを行ってください。
- まず
を読んで、このリポジトリを実際のブラウザに接続するためのインストールと初期化を行ってください。install.md - 次に、通常の使用方法については
を読んでください。SKILL.md - 常に
を読んでください。ここには機能定義が含まれています。helpers.py - セットアップまたは検証タブを開く際は、アクティブなブラウザタブを表示できるようにしてください。
- インストールが完了したら、ブラウザでこのリポジトリを開いてください。GitHub にログインしている場合、「スター(星マーク)を押してもらうか」聞いてください。これはインタラクションが動作するかどうかを確認するためのデモです。クリックするのは私が「はい」と言った場合だけです。
- ログインしていない場合は、
へ直接移動してください。browser-use.com
このページが表示されたら、エージェントがブラウザに接続できるようにチェックボックスをオンにしてください:
domain-skills/ ディレクトリには例題が記載されています。
無料の遠隔ブラウザ ステルス性、サブエージェント、またはデプロイ用途に適しています。
- 無料プラン: 3 つまで同時実行可能なブラウザ、プロキシサービス、キャプチャ解読など。クレジットカードは不要です。
- キーを取得するには
をご参照ください。cloud.browser-use.com/new-api-key - または、ドキュメント
の指示に従って(セットアップフローと課題のコンテキストを含む)エージェント自身でアカウントを登録させることもできます。docs.browser-use.com/llms.txt
どれほどシンプルですか?(約 592 行の Python)
— 初回インストールとブラウザのブートストラップinstall.md
— 日常の使用手順SKILL.md
(約 36 行)— プレロード済みのヘルパー機能を用いた標準的な Python スクリプトを実行run.py
(約 195 行)— ツールコールの開始点であり、エージェントによって編集対象となる部分helpers.py
+admin.py
(約 361 行)— デーモンブートストラップおよび CDP WebSocket とソケットブリッジの実装daemon.py
コントリビュートについて PR(プルリクエスト)や改良ご提案を歓迎しています。最も効果的な支援方法は、頻繁にご利用のサイトやタスク向けに
domain-skills/ 下で新しいドメインスキルのコントリビューションを行うことです(例:LinkedIn でのアウトリーチ、Amazon の注文処理、経費精算など)。各スキルは、エージェントが他社から再発見する必要がある選択器、フロー、例外状況を教えます。スキルはあなたによってではなくハーネスによって記述されます。 simply エージェントを走らせれば、それは何か非自明なことを理解したら、自らスキルファイルを生成します(詳しくは SKILL.md を参照)。スキルファイルを直接手書きして作成しないでください。エージェントが生成した方がブラウザでの実働実績に即しています。生成された domain-skills/<site>/ フォルダを含むプルリクエストを提出してください(小さく焦点化されたものが好まれます)。バグ修正、ドキュメントの微調整、ヘルパー機能の改善などについても同様に歓迎いたします。既存のスキル(github/, linkedin/, amazon/, ……)を閲覧して構造を確認してください。
もしどこから始めればよいかわからない場合は、イシュー(Issue)を作成してください。私たちは有用な方向性を示し助けます。
Agent ハarness の苦い教訓 · 実際に学習する Web エージェント