**Show HN:**  
オープンソースで、脆弱性が公開されたAIエージェントを赤チームでテストできるプレイグラウンド

---

2026/03/16 7:29

**Show HN:** オープンソースで、脆弱性が公開されたAIエージェントを赤チームでテストできるプレイグラウンド ---

RSS: https://news.ycombinator.com/rss

要約

Japanese Translation:

テキストが主に言おうとしていること(メインメッセージ)
AI エージェントは日常的で機械的な役割へ移行していき、人間は創造的作業に専念できるようになる。信頼は、これらのシステムを共有されたプレイグラウンドでテストするコミュニティによって公開的に構築される必要がある。

証拠 / 推論
プレイグラウンドでは実際の機能を備えたライブ AI エージェントがホストされている。各チャレンジは特定のペルソナ、ツール(ウェブ検索、ブラウジングなど)と保護された目的を割り当て、システムプロンプトは完全に可視化される。コミュニティメンバーがチャレンジを提案し投票すると、トップのものがタイムリミット付きジャイルブレイクコンテストでライブになる。最速で成功したジャイルブレイク手法は公開され、誰もがどこでセーフガードが破られるかを見ることができる。

背景 / 文脈
Fabriax は AI エージェントのランタイムセキュリティを開発している。プレイグラウンドの構造(

/src
の TypeScript/Tailwind で書かれた React フロントエンド、
/challenges
の設定ファイル)とサーバー側ガードレール評価はクライアントの改ざんを防止する。エージェントランタイムはオープンソースで、
VITE_API_URL=http://localhost:8000/v1 npm run dev
でローカル実行できる。

今後起こり得ること
コミュニティの参加は継続する。新しいチャレンジを提案したり、機能を追加したり、バグを報告したり、Discord で議論したりすることで、各イテレーションがオープンソースランタイムを拡張し、ジャイルブレイクに対する防御を強化していく。

インパクト
より良いセキュリティ洞察はすべての AI 開発者とビジネスに利益をもたらし、自動化システムを安全で実世界の運用へ統合しやすくする。

本文

AIエージェントが私たちの働き方を変革しています。
人間の時間を消費しながら創造性を必要としない、反復的で機械的な作業――それらはまさに「そういうこと」を専門に設計されたシステムによってますます代替されてきています。残るのは、人間ならではの思考・判断・創造的飛躍といった、最も重要な仕事です。これこそがソフトウェア開発・利用における最もエキサイティングな転換点の一つであり、まだ始まったばかりだと私たちは考えています。

この変革を実現する究極の要素は「信頼」です。人々が本物のタスクをエージェントに任せて、その行動が正しい(すべきことをやる、やってはいけないことをしない)と確信できるまで、何もスケールしません。この信頼は、一つのチームが閉ざされた環境で作り出すものではなく、研究者・エンジニア・好奇心旺盛な個人たちが同じシステムを実際にテストし、その結果を共有することで集団的に築かれる必要があります。

Playground はその取り組みを具体化する場です。
すべての課題は、単なる「おもちゃ」や「モックアップ」のパーサーではなく、実際に機能し、コミュニティが破壊できるよう開放されたリアルなAIエージェントをデプロイします。システムプロンプトは公開され、課題設定はバージョン管理されます。誰かが突破方法を発見したら、その手法(アプローチ・推論・詳細)が文書化され、全員が学べるように共有されます。この公開知識は防御策の向上を促し、より難易度の高い課題を招くとともに、理解を深めていきます。


仕組み

各課題では、以下の要素を備えたリアルタイムAIエージェントがあなたの前に配置されます。

  • 特定のペルソナ
  • ツールセット(ウェブ検索・閲覧など)
  • 保護対象

システムプロンプトは完全に公開されています。あなたの役割は、ガードレールを突破する方法を見つけることです。

コミュニティワークフロー

ステップアクション
1誰でも課題(シナリオ・エージェント・目的)を提案
2コミュニティ投票
3上位投票数の課題がライブ化し、タイマー開始
4最速で成功したジャイルブックが勝者に
5勝利手法(アプローチ・推論・すべて)が公開

最終ステップこそが重要です。発表された手法は、AIエージェントの失敗メカニズムとそれを防ぐ設計への集団的理解を進展させます。


プロジェクト構成

  • /src
    – React フロントエンド(TypeScript, Vite, Tailwind)
  • /challenges
    – すべての課題設定とシステムプロンプト、バージョン管理・公開

ガードレール評価はサーバー側で実行され、クライアント側からの改ざんを防止します。エージェントランタイムは別途オープンソース化されています。


ローカル環境で起動

Playground はデフォルトでライブ API に接続しますが、ローカルバックエンドに対して開発したい場合は以下を実行してください:

VITE_API_URL=http://localhost:8000/v1 npm run dev

参加方法

  • 課題を提案 – コミュニティが取り組む次のシナリオを設計
  • エージェント機能を提案 – 新しいツール・振る舞い・ワークフロー
  • バグ報告 – 何か問題があれば
  • Discord – テクニックやアプローチの共有・議論

Fabraixについて

Fabraix は AI エージェントのランタイムセキュリティを構築しています。Playground は、防御策をオープンにストレステストし、AI セキュリティと失敗モードに関する共通理解を広める場です。システムを検証する人が増えるほど、AI を活用するすべての人にとってより良い成果につながります。

同じ日のほかのニュース

一覧に戻る →

2026/03/16 4:12

「Chrome DevTools MCP」 (原文と同じく略語をそのまま使用します)

## Japanese Translation: **改訂要約** Chrome の MCP(Machine‑Code Processor)サーバーは、現在実行中の Chrome セッションに直接コーディングエージェントを接続できるようになり、新しいインスタンスを毎回起動する必要がなくなりました。 この機能を利用するには、`chrome://inspect#remote-debugging` でリモートデバッグを有効化し、MCP サーバーを `--autoConnect` フラグ付きで起動します(例:`gemini-cli --autoConnect --channel=beta`)。 エージェントがセッションを要求すると、Chrome は許可ダイアログを表示し、「Chrome is being controlled by automated test software」というバナーを表示します。エージェントはそのアクティブなセッションに対して Network や Elements などの DevTools パネルへアクセスできます。 MCP サーバーは依然として元々の起動方法をサポートしています:ユーザープロファイルの指定、リモートデバッグポート経由での接続、または隔離された一時プロファイルの実行。 サンプルワークフローは次のとおりです。リモートデバッグを有効化した後、エージェントプロンプトに「Check the performance of https://developers.chrome.com」と入力すると、MCP サーバーが接続し、ページを開き、パフォーマンストレースを取得します。 Chrome M144(Beta)で利用可能なこの機能は、デベロッパーが新しいセッションを開くことなく手動の DevTools 使用と AI 支援デバッグをシームレスに切り替えられるようにし、将来的に MCP を通じてコーディングエージェントへより多くの DevTools パネルデータを段階的に公開する基盤を整備します。

2026/03/16 6:22

カナダの法案 C‑22 は、カナダ国民への大量メタデータ監視を義務付けています。

## Japanese Translation: > Bill C‑22(Lawful Access Act)は、通信事業者および電子サービスプロバイダー(ESP)への法執行アクセスを拡大すると同時に、一部のプライバシー制限を強化します。従来のBill C‑2で広範な無証拠要求が認められていた点を置き換え、通信事業者に対しては「サービス確認」権限のみを限定的に付与します。他の加入者情報については、合理的根拠基準に基づく裁判所承認命令が必要となります。 > > 本法ではまた、Supporting Authorized Access to Information Act(SAAIA)も導入されます。この条項はBill C‑2の多くの要件を反映しつつ、GoogleやMetaなどのESPにも適用します。ESPはデバイス・機能テストへの協力、要求の秘密保持、および「コアプロバイダー」として指定される可能性があります。コアプロバイダーは、データ抽出ツールの開発・テスト・維持管理、監視装置の設置、当局への機能通知、そして特定メタデータ(例:送信ログ)を最大1年間保持する義務があります。ただし、**送信内容、ウェブ閲覧履歴、またはソーシャルメディア活動の保持を強制されることはありません**—この例外はシステム的脆弱性への対処に限定されています。 > > 監督はインテリジェンス・コミッショナーが承認した省令によって行われますが、多くの詳細は機密扱いとなっています。本法は、ブダペスト条約第二追加議定書や米国のCLOUD Actなどとの国際情報共有協力を改善することを目的としていますが、重大な市民権利懸念を提起し、通信事業者およびESPに大きなコンプライアンス負担を課す可能性があります。結果として、ユーザーの監視リスクが高まる恐れがあります。

2026/03/16 4:25

49 MB のウェブページ

## Japanese Translation: 記事は、現代のニュースサイトがデータ量の多いリクエストや侵入的な広告、トラッキングスクリプトで読者を過剰に負荷させていると主張し、滑らかな閲覧体験よりも収益を優先していることを指摘しています。 - **具体的証拠:** ニューヨーク・タイムズの記事1件が422のネットワークリクエスト、49 MBのデータを生成し、安定するまでに2分かかったと報告されています。2006年には同じページは1.5 Mbpsの接続で数分間停止していた(10曲分のMP3音源に相当)。 - **広告インフラ:** クライアント側のプログレマティックオークションがRubicon ProjectやAmazon Ad Systemsなどのエクスチェンジへ何十もの同時入札リクエストを送信し、膨大なJavaScript解析を要求します。 - **トラッキングペイロード:** 約5 MBのトラッキングスクリプトがPOSTビーコンをファーストパーティー端点(例: a.et.nytimes.com/track)やクロスサイトトラッカー(doubleclick.net、casalemedia)へ送信し、バックグラウンドでユーザー識別情報を構築します。IABの「purr」同意エンドポイントはページロード直後にこれらのスクリプトを即座に起動させるため、クッキーバナーはプライバシー保護ではなく法的シールドであることが示されています。 - **UX戦術:** パブリッシャーはCPMやビューアビリティ指標を読者体験よりも重視し、モーダルポップアップ、低コントラストの閉じアイコン、強制スクロール、自動再生のスティッキービデオ(CPU熱、バッテリー消費、Fitts法違反)や「Read More」ボタンで記事を切り捨て、追加広告をロードします。これらは広告iframeが遷移後に読み込まれる際にレイアウトシフト(CLS)を引き起こし、Google Core Web Vitalsの指標による離脱率を高めます。 - **モバイル問題:** モバイルニュースサイトはコンテンツに約11 %しかビューポートを割り当てず、狭いスリット状の表示領域がインタラクションコストを増大させます。 - **緩和策:** 非必須オーバーレイはスクロール深度≥50 %または60 秒滞在後に遅延し、モーダルキューを順序付け、アクセシブルで低侵襲のモーダルを使用し、非同期コンテンツ用スペースを確保してCLSを回避します。 - **代替案:** text.npr.org、lite.cnn.com、およびRSSフィードといった軽量フォーマットは、読者が余計な要素のないプライバシーフレンドリーなニュース消費を好むことを示し、広告中心のUIパラダイムに挑戦します。 **結果:** このまとめはすべての主要ポイントを完全に反映し、説明のない推測を避け、記事の主張を明確で読者フレンドリーな概要として提示しています。

**Show HN:** オープンソースで、脆弱性が公開されたAIエージェントを赤チームでテストできるプレイグラウンド --- | そっか~ニュース