
2026/05/28 2:42
自動化された脆弱性情報発見と再現のためのマルチエージェントLLM システム
RSS: https://news.ycombinator.com/rss
要約▶
Japanese Translation:
2025 年だけで約 5 万に達するソフトウェア脆弱性が報告されている中、現在のアートフィシャル・インテリジェンスモデルのみをセキュリティ flaw の検出に依存することは、高い偽陽性率、再現性の欠如、および複雑な依存関係についての推論の難しさという理由からリスクが高い。これらの課題に対処するため、研究者らは Google の OSS-Fuzz に基づき構築された、完全自動化された脆弱性情報分析のために設計された高度なマルチエージェントシステムである FuzzingBrain V2 を導入した。このアプローチは、すべての発見事項がファッザーで再現可能であることを保証し、「Suspicious Point」という新しい制御フロー抽象化を利用することで、最適な粒度での正確な位置特定を実現する。論理駆動の階層関数分析と高度な静的・動的ツールを組み合わせることで、システムは複雑な関数を跨ぐトリガーについて効果的に推論を行う。AIxCC 2025 データセット上のベンチマークにおいて、FuzzingBrain V2 は 40 つの脆弱性のうち 36 つを検出し、90% の検出率を達成した。実世界での展開では、該ツールは主要なオープンソースプロジェクト 12 件の間でゼロデイ脆弱性 29 つを成功裏に発見し、すべてがメンテナによって確認され、2 つの CVE ID が割り当てられた。Ze Sheng によって作成されたこの提出は、AI が人類開発者の負担を著しく軽減しつつ、重要なソフトウェアサプライチェーンを保護できることを示している。
Text to translate:
With nearly 50,000 software vulnerabilities reported in 2025 alone, relying solely on current Artificial Intelligence models to detect security flaws is risky due to high false positive rates, lack of reproducibility, and difficulty reasoning about complex dependencies. To address these challenges, researchers introduced FuzzingBrain V2, a sophisticated multi-agent system designed for fully automated vulnerability analysis built on Google's OSS-Fuzz. This approach ensures all findings are fuzzer-reproducible and utilizes a novel control-flow abstraction called "Suspicious Point" to achieve precise localization at optimal granularity. By combining logic-driven hierarchical function analysis with advanced static and dynamic tools, the system effectively reasons about complex cross-function triggers. In benchmarks on the AIxCC 2025 dataset, FuzzingBrain V2 achieved a 90% detection rate (36 of 40 vulnerabilities). In real-world deployment, the tool successfully discovered 29 zero-day vulnerabilities across twelve major open-source projects, all of which were confirmed by maintainers and resulted in two assigned CVE IDs. Authored by Ze Sheng, this submission demonstrates that AI can significantly reduce the burden on human developers while securing critical software supply chains.
本文
FuzzingBrain V2: LLM ベースの脆弱性発見における課題と解決策
背景と課題
ソフトウェアの脆弱性は深刻なセキュリティ脅威です。2025 年には約5 万件の CVE(Common Vulnerabilities and Exposures)が発見されています。大規模言語モデル(LLM)は自動検出において大きな可能性を秘していますが、以下の三つの主要な課題が残っていました。
- 誤陽性率の高さと検証不足
- LLM が生成する脆弱性情報報告には誤陽性率が非常に高いです。
- 再現性を確保した検証が十分に行われていませんでした。
- 粒度設定の最適化の問題
- 関数レベルでの解析:文脈が膨大化する際にバグを見逃す傾向がありました。
- クラス(行)レベルでの解析:不足する文脈によって限界が生じていました。
- 複雑な依存関係への対応困難
- 複数の関数間にある複雑な依存関係やトリガー条件を持つ脆弱性について、既存のアプローチは推論において困難を伴っていました。
解決策:FuzzingBrain V2
本稿では、上記のギャップを埋めるマルチエージェントシステム**「FuzzingBrain V2」**を紹介します。その効果は以下の四つの主要な貢献事項を通じて示されます。
- 完全自動化分析による再現性保証
- Google のOSS-Fuzzを基盤とした脆弱性情報の完全自動化分析を実施。
- 報告されたすべての脆弱性が**ファッザ(fuzzer)**を用いて再現可能であることを保証します。
- 新たな制御フローに基づく抽象化手法「Suspicious Point」
- 正確な粒度で脆弱性を特定するための新手法を提案。
- 文脈の最適化を実現します。
- ロジック駆動型の階層的手法
- リソース制約下でも機能カバレッジを高めるために、二層構造のファッジングを組み合わせます。
- 階層的に機能解析を行うロジック駆動型の手法を導入。
- コンテキストエンジニアリングと静的・動的分析ツールの統合
- MCP ベースのアプローチを実装し、静的および動的分析ツールを統合。
- コンテキストエンジニアリングを活用して複雑な脆弱性の推論能力を向上させます。
実績と成果
AIxCC 2025 ファイナルコンペティションでの結果
C/C++ データセットにおける検証結果は以下の通りです。
- 検出率:90%
- 対象となった脆弱性数:40 件中 36 件の発見に成功しました。
実際の運用環境での成果
オープンソースプロジェクトへの適用では以下の成果を挙げています。
- ゼロデイ脆弱性の発見
- 12 プロジェクトに跨ってゼロデイ脆弱性 29 件を発見。
- すべてメンテナーによる確認および修復が完了済み。
- CVE ID の付与状況
- 発見されたうち、そのうち2 件のみに対して CVE ID が付与されました。
提出履歴:Ze Sheng [バージョン 1] / 2026 年 5 月 20 日 22:17:14 UTC (ファイルサイズ: 1,827 KB)