
2026/06/20 22:49
Show HN: 私たちは、拒否する代わりにペネトレーションテストを行うモデルを事前学習しました。
RSS: https://news.ycombinator.com/rss
要約▶
Japanese Translation:
argusredは、CosineAIによって開発されたCLIツールで、特許出願中のモデルを用いてセキュリティスキャンと承認されたペネトレーションテストを一元化するものです。汎用的なツールや理論的な評価とは異なり、argusredはコードベース内で厳密に根拠に基づいた脆弱性情報の分析を提供します。このツールは、未承認のファイル書き込みやコマンド実行をブロックするため、読み取り専用のGo製のハネスにより強制される堅牢な安全性アーキテクチャを搭載しています。
このツールには以下の2つのモードが用意されています:
- Security Scan(受動的コード分析):アクティブなモジュール全体にわたる依存関係の脆弱性、SQLi/XSSベクトル、シークレット検出をカバーします。
- Pen Test(明示的に承認されたターゲットに対する能動的攻撃)。ペネトレーションテストモードには、ポートフィンガープリンティング、TLS分析、ペイロード注入が含まれ、ブルートフォース攻撃やエクスプロイトチェーン構築などのオプションの深い取り組みも可能です。重要なのは、能動的テストはPen Testモードに限定されており、標準的なスキャンはファジングやDAST(動的アプリセキュリティテスト)を行わず、コード解析と推論のみに基づくことです。
実行安全性とネットワークスコーピングは厳格に強制されます:エージェントは必須の署名済み承認(booking)で定義されたホストのみに制限され、隣接システムへのアクセスは禁止され、時間枠内での動作が義務付けられます。エクスプロイト検証を有効化することで、隔離されたDockerコンテナ内または読み取り専用のファイルシステムに対して安全に問題を再現し、報告される見つけが理論的ではなく実際のもの임을保証できます。
攻撃的なセキュリティの深さを目的として特別に開発されたargusredは、Cosineのポスト訓練済みモデルを採用し、曖昧な「雰囲気ベース」のリスクを回避します。大規模なコードベースも対応可能で(例:並列スワームによる約40分間での約150万行)、局所Markdownレポートとしてエグゼクティブサマリー、深刻度評価、具体的な修正方法を出力します。インストールは無料であり、新規アカウントには200万トークンの無料枠が付与されます。その後、スキャンとペネトレーションテストのエンゲージメントはスコープと努力量に基づいて標準的な料金体系に従います。コーディングエージェントワークフローとのシームレスな統合を通じて、argusredはセキュリティを予測から再現可能な証拠へと転換させます。
本文
ArgusRed: コード監査と攻撃シミュレーションツール
ArgusRed は、セキュリティスキャン(コード分析)とペネトレーションテスト(承認されたシステムに対する攻撃試行)の 2 つの機能を統合した CLI ツールです。
インストール方法
argusred を導入する主な方法如下:
# Homebrew (MacOS/Linux) brew install CosineAI/argusred/argusred && argusred # 公式インストーラー curl -fsSL https://raw.githubusercontent.com/CosineAI/argusred-dist/main/install.sh | sh
注意: Windows へのサポートは近日公開予定。
セキュリティスキャンモード
概要と機能
- コードベースの分析に基づき、以下の情報をマークダウンレポート形式で出力します:
- 発見箇所の場所
- 重大度(Critical / High / Medium / Low)
- 原因
- 改善方向
- 無料利用: 初めての起動時に Cosine のアカウント作成が求められ、新規ユーザーには200 万トークンの無料クレジットが付与されます。
実行手順
- リポジトリへ移動:
cd path/to/your/repo - ツールを実行:
argusred - 第 1 回起動: Cosine アカウント作成 → 無料クレジット付与済み状態へ移行。
スキャン設定 (argusred v2.0.19
)
argusred v2.0.19以下の 8 モードのうち、5 つを有効にします(×: 無効、□: 有効)。
-
スキャン対象範囲:
- [×] 依存関係の脆弱性分析
- [×] シークレットおよび認証情報の検出
- [×] SQL インジェクション/XSS ベクターの検出
- [ ] 認証とセッションフローの解析
- [ ] 入力検証とサニタイゼーション
- [ ] CORS および CSP の設定不備の検出
- [ ] 暗号化の弱さスキャン
- [×] ファイル権限およびアクセス制御の確認
-
攻撃検証 (Penetration Test): レポート後に発見事項を安全に再現する機能を有効可。デフォルトは無効。
-
エージェントの権限:
- ターミナルアクセス: 無効
- ネットワークリクエスト: 無効
- ファイル書き込み: サンドボックス化(制限済み)
サンプルスキャン出力
ツールは
.argusred/scan-<日付>.md という形式のレポートを生成します。
- 内容: 総括概要、各モジュールの発見事項、詳細情報。
- 検出例: 「複数の重大な脆弱性と高深刻度障害が検出されました:すべての台帳サービスでトークンの偽造が可能に。バージョン管理システム内に RSA 個人鍵を含むシークレットがハードコーディングされています。」
安全制約と仕組み
- 改変禁止: コードは絶対に変更不要です。Go ハレスにより読み取り専用強制適用され、ファイル書き込みやコマンド実行がブロックされます。
- 手法制限: フuzziングやライブ攻撃(DAST)は行いません。積極的なテストはペネテストモードにて実施。
- 根拠重視: コードに基づかない推測や感受性に基づく脆弱性の報告は含まれません。
効率性とコスト
- 処理速度: モジュールが並列動作するため、コード規模に反比例して高速化されます。
- 6 モード・3 万行:約10 分。
- Symfony(150 万行): 完全スキャンで約40 分。
- コスト: 第 1 回実行時は 200 万トークン無料。以降は標準レートが適用されます。
ペネトレーションテストモード
概要と機能
セキュリティスキャンとは異なり、承認されたシステムに対して実際に攻撃を試みます。
- コードを読むだけでなく、実際の被害再現を目標とします。
- アクセスは予約・範囲設定による明確な文書化が必須です。
- 成果物は「エンゲージメント概要」レポートです。
実行手順と設定 (argusred vnightly-906
)
argusred vnightly-9061. ターゲットの設定
- 承認されたシステムのみを追加します(
キーで入力)。a - 初期状態: ターゲット未登録。
2. 労力レベルの選択
- Passive / Aggressive
- リコン(探索):
→ライト
→モデレート
→ディープアグレッシブ- 意図的なプロビングにより WAF ルールやレート制限をトリガーする可能性があります。破壊行為は行いません。
3. テクニックの選択 (労力レベルに応じて)
- [×] ポートおよびサービスフィンガープリンティング
- [×] ヘッダーおよび TLS 分析
- [×] ディレクトリおよびエンドポイントの列挙
- [×] ペイロードインジェクション(SQLi, XSS, SSTI など)
- [ ] 暴力攻撃による認証情報の散布 (ディープ)
- [ ] 脆弱性チェーンの構築 (アグレッシブ)
- [ ] サービス拒否(DoS)への耐性テスト (アグレッシブ)
4. エージェントの権限
- ターミナルアクセス: 有効
- ネットワークリクエスト: 有効
- ファイル書き込み: サンドボックス化(制限済み)
見積もりと開始
- 現在の設定例:
- ターゲット: 0 ホスト | 労力: モデレート | テクニック: 4 クラス
- 推定時間: 約1 分 | エージェントサイクル: 約2〜3 回
- アクション: ▶ ペネテスト開始 / キャンセル
サンプルペネテスト出力
ファイル:
.argusred/pentest-<日付>.md
- 内容: ステータスカウント、範囲詳細、再現スクリプトを含む確認された攻撃。
- 検出例:
- JWT 署名回避 (Critical, CVSS 8.6):
において偽造トークンが返却(200 OK)。管理領域権限付与確認。POST /v1/sessions/refresh - OAuth SSRF (High, CVSS 7.4):
のオープンリダイレクトにより、任意の内部 URL が解決される現象を確認。/oauth/authorize
- JWT 署名回避 (Critical, CVSS 8.6):
安全制約と遵守
- 未許可実行不可: 署名された権限なしでは動作しません。法的な予約ステップを踏む必要があります。
- 範囲の強制拡大禁止: 発見事項に関わらず、承認されたターゲットのみを対象とします。
- 時間枠厳守: 予約されたスロットを過ぎたら直ちに停止します(効力スラップ)。
- 権限エスカレーション禁止: 予約された権限以上のアクセスが必要となった場合は即座に停止し、その旨を報告します。
ペネテストとスキャンの違い
| 項目 | セキュリティスキャン | ペネトレーションテスト |
|---|---|---|
| 対象 | コードベースのみ | 実行中のシステム(ホスト/URL) |
| 手法 | 分析・推測 | 実装による攻撃試行 |
| 権限 | 読み取り専用 | ネットワークアクセス有効 (限定) |
| 成果物 | 監査レポート | エンゲージメント概要 |
コストと見積もり
- 決定方法: エンゲージメント開始時の予約時点で、範囲と労力レベルに基づき価格が決定されます。
技術アーキテクチャ
- ベースモデル: Cosine 独自開発のモデルを使用します。市販 API やプロンプトラッパーではなく、「攻撃に値するコード部分を読まない」ことを前提としてポストトレーニング済みです。
- 安全な実装 (Go ハレス):
- モデルからの要求は一切受け付けない層ではありません。Go ハレスが下層でツール呼び出しを実行前に遮断します。
- スキャンモード: 変更系ツール(ファイル書き込み、コマンド実行)は厳格にブロック。読み取り専用はオプションのフラグではなく必須。
- ペネテストモード: ネットワークエグレスは予約されたターゲットのみへ制限。
- 配布形態:
- Homebrew (
) またはbrew
でインストールするバイナリを使用します(オープンソースではありません)。curl - ローカルマシンで動作し、ファイアウォール経由でも動作を確認可能です(例:
による挙動確認)。tcpdump
- Homebrew (