Show HN: ブラウザハーネス(Harness)—— 大規模言語モデル(LLM)にあらゆるブラウザタスクを完遂する自由を賦与します。

2026/04/24 23:31

Show HN: ブラウザハーネス(Harness)—— 大規模言語モデル(LLM)にあらゆるブラウザタスクを完遂する自由を賦与します。

RSS: https://news.ycombinator.com/rss

要約

Japanese Translation:

このブレイクスルーでは、CDP(Chrome DevTools Protocol)上に直接構築された自己修復機能を持つ最も薄いハーネスが導入され、Large Language Models(LLM)にブラウザのあらゆるタスクを完了させるための完全な自由度を提供します。エージェントは helpers.py 内でタスク途中で欠落している機能を記述でき、例えばファイルアップロードを可能にするために helpers.py を 192 行から 199 行へと編集する例があります。セットアップは簡単です:Claude Code または Codex に「Set up https://github.com/browser-use/browser-harness for me」という指示を貼り付け、その後 browser connection については install.md、usage については SKILL.md、available functions については helpers.py を読むというフローに従ってください。接続後、検証ページのチェックボックスにチェックを入れてアクセス許可を与えます。無料プランでは cloud.browser-use.com/new-api-key にてカードの登録なしで 3 つの同時実行可能なリモートブラウザ、プロキシ、Captcha の解決が利用可能であり、LLM は docs.browser-use.com/llms.txt を介して API キーの登録を自律的に行うことができます。このプロジェクトは約 592 行のコンパクトな Python セットアップ(run.py で約 36 行、helpers.py で約 195 行、admin.py と daemon.py で約 361 行)です。スキルファイルを手作りで作成するのではなく、LinkedIn や Amazon など特定のサイト向けに domain-skills/ 下にカスタムドメインスキルの貢献が推奨され、github/、linkedin/、amazon/ の既存の例を参照してください。ハーネスはエージェントがタスク実行中に明らかな選択条件(selector)、フロー、またはエッジケースを発見した際に自動的に新しいドメインスキルを生成します。ドメインスキル、バグ修正、ドキュメントの微調整のための PR などの貢献は歓迎され、複雑なワークフローの手作りによる必要性を減らしつつ、プルリクエストと自動的なスキル生成によって駆動される進化へと業界を転換させていきます。

本文

最もシンプルで薄く、自己修復機能を備えたハーネスであり、LLM がブラウザのあらゆるタスクを完全に自由に実行できるようにするものです。CDP(Chrome DevTools Protocol)に直接構築されています。エージェントはタスクの途中で欠けているコードを書き込みます。フレームワークなし、レシピなし、レールなし。クロームへの接続は単一の WebSocket で、その間に何も介在しません。

  • エージェント: ファイルをアップロードしたい
    • Helpers.py
      upload_file()
      が欠落していることに気づく
    • エージェントがハーネスを編集し、コードを
      helpers.py
      に書き込む(192 行から 199 行へ)
      • + upload_file()
        を追加
    • ファイルがアップロードされました

これにより、ブラウザを使用する必要がなくなります。

セットアップのプロンプト Claud Code または Codex に貼り付けてください:

https://github.com/browser-use/browser-harness
のためのセットアップを行ってください。

  1. まず
    install.md
    を読んで、このリポジトリを実際のブラウザに接続するためのインストールと初期化を行ってください。
  2. 次に、通常の使用方法については
    SKILL.md
    を読んでください。
  3. 常に
    helpers.py
    を読んでください。ここには機能定義が含まれています。
  4. セットアップまたは検証タブを開く際は、アクティブなブラウザタブを表示できるようにしてください。
  5. インストールが完了したら、ブラウザでこのリポジトリを開いてください。GitHub にログインしている場合、「スター(星マーク)を押してもらうか」聞いてください。これはインタラクションが動作するかどうかを確認するためのデモです。クリックするのは私が「はい」と言った場合だけです。
  6. ログインしていない場合は、
    browser-use.com
    へ直接移動してください。

このページが表示されたら、エージェントがブラウザに接続できるようにチェックボックスをオンにしてください:

domain-skills/
ディレクトリには例題が記載されています。

無料の遠隔ブラウザ ステルス性、サブエージェント、またはデプロイ用途に適しています。

  • 無料プラン: 3 つまで同時実行可能なブラウザ、プロキシサービス、キャプチャ解読など。クレジットカードは不要です。
  • キーを取得するには
    cloud.browser-use.com/new-api-key
    をご参照ください。
  • または、ドキュメント
    docs.browser-use.com/llms.txt
    の指示に従って(セットアップフローと課題のコンテキストを含む)エージェント自身でアカウントを登録させることもできます。

どれほどシンプルですか?(約 592 行の Python)

  • install.md
    — 初回インストールとブラウザのブートストラップ
  • SKILL.md
    — 日常の使用手順
  • run.py
    (約 36 行)— プレロード済みのヘルパー機能を用いた標準的な Python スクリプトを実行
  • helpers.py
    (約 195 行)— ツールコールの開始点であり、エージェントによって編集対象となる部分
  • admin.py
    +
    daemon.py
    (約 361 行)— デーモンブートストラップおよび CDP WebSocket とソケットブリッジの実装

コントリビュートについて PR(プルリクエスト)や改良ご提案を歓迎しています。最も効果的な支援方法は、頻繁にご利用のサイトやタスク向けに

domain-skills/
下で新しいドメインスキルのコントリビューションを行うことです(例:LinkedIn でのアウトリーチ、Amazon の注文処理、経費精算など)。各スキルは、エージェントが他社から再発見する必要がある選択器、フロー、例外状況を教えます。スキルはあなたによってではなくハーネスによって記述されます。 simply エージェントを走らせれば、それは何か非自明なことを理解したら、自らスキルファイルを生成します(詳しくは
SKILL.md
を参照)。スキルファイルを直接手書きして作成しないでください。エージェントが生成した方がブラウザでの実働実績に即しています。生成された
domain-skills/<site>/
フォルダを含むプルリクエストを提出してください(小さく焦点化されたものが好まれます)。バグ修正、ドキュメントの微調整、ヘルパー機能の改善などについても同様に歓迎いたします。既存のスキル(github/, linkedin/, amazon/, ……)を閲覧して構造を確認してください。

もしどこから始めればよいかわからない場合は、イシュー(Issue)を作成してください。私たちは有用な方向性を示し助けます。

Agent ハarness の苦い教訓 · 実際に学習する Web エージェント

同じ日のほかのニュース

一覧に戻る →

2026/04/25 4:30

私のオーディオインターフェースは、SSH がデフォルトで有効になっています。

## Japanese Translation: Rodecaster Duo は、ファームウェア署名検証の欠如に起因する深刻なセキュリティ脆弱性を有しています。この欠陥は、研究者がコンテナを通じて SSH パスワード認証を有効にする自製ファームウェアの開発および展開に成功した事例から明らかとなりやすく、カスタムソフトウェアへのフラッシングを可能にしています。同装置は USB 書き込みを無効化することでブリック状態を防ぐように設計されていますが、この制限は回避可能であり、初期試みが失敗した場合(例:macOS)や予期せずトリガーされた場合でもファームウェア更新が進められる可能性があります。USB HID プロトコルの解析により、ファームウェア更新はレポート 1 を介して送信される単純な ASCII コマンド('M」と 'U」)によって開始されることが明らかとなり、実際のファイル操作にはディスクのマウント、`archive.tar.gz`および`archive.md5`の複製、許可付きパーミッションの設定(777)、そして再起動が含まれます。同装置はデフォルトで公開鍵認証とハードコードされた鍵を使用した SSH が有効になっており、これらの鍵が変更されない場合、セキュリティリスクを引き起こします。これらの欠陥についてサポートチケットへの回答はなく、システムのオープンな性質が、この専門的なオーディオツールを有益な改変のプラットフォームであると同時に、潜在的なセキュリティ侵害のプラットフォームにも変えつつあります。

2026/04/25 4:01

クラシック・アメリカン・ダイナー

## Japanese Translation: 米国のダイナーは、輸送史と料理文化の独自の融合を表しており、20 世紀に鉄道輸送用に製造された列車車から、象徴的な路辺のレストランへと進化してきました。歴史記録によれば、主要な高速道路沿いには多様なメニューが提供されており、1940 年夏のマーランド州バーウィン近郊のダイナーではホットドッグが 5 セント、プレートが 25 セント、ニューヨーク市の施設では 1959 年に朝食プレートが 75 セントで提供されていました。長い労働時間に対応するため、多くの場所はアバディーン(マリーランド州)などで見られるように 24 時間営業のモデルを採用し、トラックドライバーだけでなく一般住民もアクセスできるようにしました。国会図書館はこれらの施設の建築的多様性を捉えた広範な写真アーカイブを保管しており、ジョージア州カラムスにあるルート 27 ダイナー(韓国料理も販売している)の波打つ金属製の外観から、バーモント州チェスターにある「ストリームライン」アルミニウム仕上げのクラウニーガールダイナーまで多岐にわたります。これらの画像は単なる食料供給を超え、ダイナーを米国人の好意と国家の記憶を象徴する強力なシンボルとして示しており、20 世紀初頭からの文書からキャロル・M・ハイズミスの作品のような現代アーカイブに至るまで、ピジョンフォージにあるサンライナーダイナーやフェニックスにある5&ダイナーなどの現場を捉えています。

2026/04/24 23:28

過剰な思考、スコープクリープ、そして構造的相違によって引き起こされるプロジェクトへの sabotaging です。

## Japanese Translation: 著者は「やってみるか」という哲学を提唱し、広範な調査よりも即時の作成を優先することで楽しみを保ち、スコープの蔓延を防ぐことを重視する。この転換は、ハードウェアのプロトタイピングインターフェース、Clojure+Rust 融合言語、CAD プログラミングといった長年にわたる技術的関心を扱うが、焦点のない成功基準により数百時間の投入にも関わらず合成された解決策をもたらさず、こうしたサイクルを打破するために著者は迅速なプロトタイピングに注力する。友人の Marcin と一緒に週末プロジェクトとして製作した合板の棚は、機能的成果に絞って完璧な仕様ではなくてはしごを作ったものであり、逆にリソースが不要な機能や過剰な調査に浪費されるときには失敗する。具体的には、LLM エージェントプロジェクト(Finda スタイルのファイルシステム検索)でアンカー機能を見捨てること、difftastic、semanticdiff.com、diffsitter などのツールを数時間レビューして高レベル構造を正しく処理できないことが判明した例などが挙げられる。こうした限界に失望した著者は、Tyvek/ライトディフューザー材料の EU ベンダーを探したり、Coinbase クリプト破産分析から酵母ワクチンや Loon Lisp まで幅広い話題に触れたりする雑多な更新事項も記録している。

Show HN: ブラウザハーネス(Harness)—— 大規模言語モデル(LLM)にあらゆるブラウザタスクを完遂する自由を賦与します。 | そっか~ニュース