Show HN: カーソルを盗むことなく、バックグラウンドで任意の macOS アプリを操作できる機能を発表します。

2026/04/29 1:03

Show HN: カーソルを盗むことなく、バックグラウンドで任意の macOS アプリを操作できる機能を発表します。

RSS: https://news.ycombinator.com/rss

要約

Japanese Translation:

Cua プラットフォームは、バックグラウンドでのタスク実行を可能にし、フォーカスを奪ったりカーソルを制御したりせず、ネイティブアプリ(ゲーム、クリエイティブツール (Blender, Figma)、モバイルデバイスなど)との協力や自然なユーザー体験の維持を実現することで、AI とコンピュータの相互作用を革新します。特定のアプリケーション用の専用ドライバと、専用のボットマネージャーに基づき構築された Cua は、Linux 仮想マシンを Lume を介して管理し、Apple の Virtualization.Framework を利用してローカル環境からクラウドインスタンスに至るまで多様な環境でネイティブに近い速度を実現することで、Apple Silicon におけるパフォーマンスを最適化します。エコシステムは Linux、macOS、Windows、Android を含む任意の OS を H.265 ウィンドウサポート、共有クリップボード、オーディオ同期などの機能を備えた単一の API でサポートし、Python 3.11+ を支援しています。これにより、エージェント対応型サンドボックスや共同利用型のコンピュータ使用が可能になります。開発者や研究者を支援するため、Cua は包括的なベンチマーク (OSWorld, ScreenSpot) と自律型エージェントの評価用の RL 環境が付随した開かれた MIT ライセンスを提供します。プラットフォームはコアコンポーネントのインストールスクリプトと CLI ツール(例:

cuabot
,
cua-agent
,
cua-bench
)のスーートを提供し、文書、ブログ、Discord チャンネルを含むコミュニティリソースでサポートされています。

本文

Cua:あなたの道筋を選ぼう

Cua Driver — macOS 上のバックグラウンドコンピュータ使用

あらゆるネイティブの macOS アプリを背景で操作可能。エージェントはカーソル、フォーカス、またはスペースキーを奪うことなくクリックや入力、検証を行えます。さらに、Chromium ベースのウェブコンテンツや Canvas ベースのツール(Blender、Figma、DAW、ゲームエンジンなど)といった非 AX シュアface でも動作します。

  • CLI または MCP サーバーを通じて、Claude Code、Cursor、およびカスタムクライアントと連携可能です。
  • 各セッションは再プレイ可能な経路として記録されます。
/bin/bash -c "$(curl -fsSL https://raw.githubusercontent.com/trycua/cua/main/libs/cua-driver/scripts/install.sh)"

完全なツール参照:

libs/cua-driver/README.md
(アーキテクチャの概要と Claude Code のスキルも含まれています)。


Cua — 任意の OS に対応したエージェント対応サンドボックス

画面を見、ボタンをクリックし、タスクを自律的に完了させるエージェントを構築します。VM やコンテナイメージに対しては、クラウドかローカルかに関わらず、統一された単一の API を提供します。

要件とセットアップ

  • Python 3.11 以降が必要です。
  • Image
    および
    Sandbox
    クラスは、OS やランタイムに依存しない一貫した API を提供します。

使用例

from cua import Sandbox, Image

async with Sandbox.ephemeral(Image.linux()) as sb: # または .macos()、.windows()、.android()
    result = await sb.shell.run("echo hello")
    screenshot = await sb.screenshot()
    await sb.mouse.click(100, 200)
    await sb.keyboard.type("Hello from Cua!")
    await sb.mobile.gesture((100, 500), (100, 200)) # マルチタッチジェスチャー

サポートされているプラットフォーム

プラットフォームクラウド (cua.ai)ローカル (QEMU)
Linux コンテナ
Linux VM
macOS
Windows
Android🔜 近日公開予定
BYOI (.qcow2, .iso)🔜 近日公開予定

開始するサンプルAPI リファレンス


CuaBot — 任意のエージェント向け協業型コンピュータ使用

CuaBot は、あらゆるコードエージェントにシームレスなサンドボックスを提供します。個々のウィンドウはデスクトップ上にネイティブに表示され、H.265 動画共有、クリップボード同期、オーディオ機能を備えています。

コマンド

npx cuabot              # オンボーディングのセットアップ
cuabot claude           # サンドボックス内で Claude Code を実行
cuabot openclaw         # サンドボックス内で OpenClaw を実行

# サンドボックス内での任意の GUI ワークフローを実行
cuabot chromium
cuabot --screenshot
cuabot --type "hello"
cuabot --click <x> <y> [button]
  • エージェント用ブラウザおよびエージェント用デバイス(iOS、Android)へのネイティブなサポートがあります。

Cua-Bench — ベンチマークおよび RL 環境

OSWorld、ScreenSpot、Windows Arena、そしてカスタムタスクにおいて、コンピュータ使用型エージェントを評価します。トレーニング用に経路データを出力可能です。

使用方法

cd cua-bench
uv tool install -e . && cb image create linux-docker

# エージェントを使ってベンチマークを実行
cb run dataset datasets/cua-bench-basic --agent cua-agent --max-parallel 4

開始するパートナーシップレジストリCLI リファレンス


Lume — macOS 仮想化

Apple Silicon で Apple の Virtualization.Framework を利用し、ネイティブに近いパフォーマンスで macOS/Linux VM を作成・管理します。

使用方法

# Lume をインストール
/bin/bash -c "$(curl -fsSL https://raw.githubusercontent.com/trycua/cua/main/libs/lume/scripts/install.sh)"

# macOS VM をプルして起動
lume run macos-sequoia-vanilla:latest

開始するFAQCLI リファレンス


パッケージ

パッケージ説明
cuabot
マルチエージェント向けコンピュータ使用サンドボックス CLI
cua-agent
コンピュータ使用タスク向けの AI エージェントフレームワーク
cua-sandbox
サンドボックスの作成・制御用の SDK
cua-computer-server
サンドボックス内の UI 操作とコード実行用ドライバ
cua-bench
コンピュータ使用向けベンチマークおよび RL 環境
lume
Apple Silicon 向けの macOS/Linux VM マネージメントツール
lumier
Lume VM への Docker 互換インターフェース

リソース

  • ドキュメント: ガイド、サンプルコード、および API リファレンス。
  • ブログ: チュートリアル、アップデート、および研究成果。
  • Discord: コミュニティサポートと議論。
  • GitHub Issues: バグ報告と機能リクエスト。

貢献

私たちは貢献を歓迎いたします!詳細については、貢献ガイドライン)をご覧ください。

ライセンス

MIT License — LICENSE ファイルの詳細をご覧ください。

サードパーティ製コンポーネント

サードパーティ製のコンポーネメントは独自のライセンスを持ちます:

  • Kasm (MIT)
  • OmniParser (CC-BY-4.0)
  • オプションの
    cua-agent[omni]
    は ultralytics (AGPL-3.0) を含む場合があります。

商標

Apple、macOS、Ubuntu、Canonical、Microsoft はそれぞれ所有者の商標です。本プロジェクトはこれらの企業と関係がなく、また承認されていません。

同じ日のほかのニュース

一覧に戻る →

2026/04/29 4:44

Ghostty は GitHub から撤退します。

## Japanese Translation: GitHub ユーザー 1299 が 18 年にわたり作成・維持してきたターミナルエミュレータ Ghostty が、プラットフォーム上の重要なインフラ障害の発生により、創始者が現在それを重大な業務に不適切と見なし始めたことを受け、公式に GitHub を離れる予定である。最近の GitHub Actions の停電は数時間ほど PR レビューをブロックし、これは Git そのものの問題ではなく GitHub サービス自体の構造的な問題を浮き彫りにしている。同月中盤の主要な GitHub 障害(同日に Elasticsearch の障害も発生したが別の事件)と時期を同じくしてこの週に終了した議論が、プロジェクトの移行計画を見事に実現させながら、現在の URL で即時のコードアクセスのために読み取り専用ミラーを維持するという方針で進められた。創始者は、新たなホスティングソリューションを探す過程で、商業的およびフリーソフトウェアの複数のプロバイダーから依存関係を段階的に削除していくことを意図している。この動きは、不揃いなサービスレベルを持つ主要プラットフォームに依存するオープンソースプロジェクトの長期的な持続可能性に対する業界全体の懸念の高まりを示しており、維持者は利便性よりも安定性を最優先することを促している。

2026/04/29 8:54

ChatGPT も広告を表示しています。以下がその全体的な帰属循環のプロセスです。

## Japanese Translation: OpenAI は、ChatGPT に独自の広告システムを直接統合し、SSE ストリームに `single_advertiser_ad_unit` オブジェクトを注入し、クリエイティブ資産を独自ドメインである `bzrcdn.openai.com` 上にホストしています。ブラウザには OAIQ v0.1.3 という追跡用 SDK が実行されており、製品の閲覧情報を OpenAI のサーバーへ報告しています。このシステムは Fernet 暗号化されたトークン(例:`ads_spam_integrity_payload`, `oppref`, `olref`, `ad_data_token`)を使用しており、これらは公衆向けのヘッダーバイトを 9 文字含み、トークンの発行時刻の復元を可能にしています(例:2026 年 4 月 26 日)。クリックされたリンクは外部ではなく ChatGPT の内部ウェブビュー内(`open_externally: false`)で開かれるため、OpenAI はクリック後のナビゲーションを観察できます。アトリビューションチェーンには、720 時間の有効期限を持つファーストパーティcookieに格納されるフォワードトークン(`__oppref`)と、impression ログを記録する `olref` が使用されます。コンテキストターゲティングは、北京旅行、フライト、NBA など 6 つの異なる会話トピックで確認されています。広告出稿元には Grubhub や GetYourGuide があります。追跡を軽減するには、ドメイン `bzrcdn.openai.com` と `bzr.openai.com` をフィルタリングし、cookie(例:`__oppref`, `__oaiq_domain_probe`)を確認する必要があります。

2026/04/29 6:17

GitHub に至るまで

## 日本語訳: 中心的な論点是、GitHub が有用なツールから、オープンソースのアイデンティティに依存する脆弱で中央集権的なインフラへと進化しすぎているという点にある。この依存関係は危険であり、企業の管理不備と不安定性が、過去の記録と長年にわたって構築されたコミュニティへの信頼の双方を脅かしている。GitHub はコード共有を円滑化させ、事実上のプロジェクト放棄フォーク、イシュー、議論などのアーカイブとなったが、その台頭は npm エコシステムなどにおけるマイクロ依存関係の爆発的増加と同時期に起きたものである。 GitHub を以前に、オープンソースは評判、メーリングリスト、信頼できるメンテナ、そしてより多くの管理努力を要するが制御とコミュニティの文脈を保持できる自己ホスト化インフラ(例:Trac、Subversion)などに基づいていた。Git の分散型の性質が広く普及したにもかかわらず、GitHub はホスティングを単一の商用エンティティに集約し、これはソフトウェアコモンズの皮肉な中央集権化である。今日では、いくつかのプロジェクト(Ghostty、Strudel、Tenacity など)は、不安定なベンダーへの依存を回避するために、Codeberg などの独立したホスティングへ移行している。 今すぐ必要なのは、商業的モデルから完全に切り離された、公衆向けの資金を十分に得たアーカイブを作り、重要コード、リリースアソートメント、およびセキュリティ勧告や設計論争などを含む歴史的議論を保存することである。現在のようにプラットフォームの変更や急激な移行によって消えてしまう場合である。そのようなレジリエントなバックアップがない場合、業界は社会的歴史の不可逆的な損失に直面し、コミュニティが孤立しデータが脆弱になるリスクを抱えることになる。著者は GitHub の回復を望みつつも、オープンソースの歴史に対して単一のプラットフォームへの依存は無責任であると論じており、将来には pre-GitHub 時代の教訓と GitHub エポックの実態とのバランスが必要であるべきである。

Show HN: カーソルを盗むことなく、バックグラウンドで任意の macOS アプリを操作できる機能を発表します。 | そっか~ニュース