Japanese Translation:

Anthropic の Mythos および Fable モデルは、専門家向けタスクおよび完全な攻撃チェーン試験を目的とした高度なサイバーレンジツールとして導入され、当初は「Project Glasswing」という名目で提供され、アクセスが 50 機関に制限されていたものが後に 150 機関へ拡大しました。評価者である英国政府の AI セキュリティ研究所などからスケーラビリティ、低い偽陽性率（Cloudflare はそのパフォーマンスを人間テストャーを上回ると指摘）、そして歴史的脆弱性の発見（OpenBSD の 27 年前のバグや FFmpeg の 16 年前の問題の例を含む）といった主張について称賛され、「The Last One」をサイバーレンジ試験で達成した最初のモデルと謳われましたが、これらの初期の成功の一部は、前例のない発見の難しさではなく、広範な影響を与える古いバグへの帰属があったためです。Mythos の結果の約半分しか見つけられないという小規模 LLM を用いた複製尝试では、以前のモデルも問題を検出することはできましたが、Mythos のような有効なエクスプロイトを生産できず失敗したこともありました。Advanced CTF Challenges における GPT-5.4 や Opus 4.6 に匹敵する高いベンチマークパフォーマンスにもかかわらず、成熟した環境での実用的な企業試験では限界が明らかとなり、これらのモデルはベンチ马克にはない能動的防衛者や高度な防衛ツールの前では「ノイジーで不器用」と見えるようになりました。2026 年 6 月（更新：2026-06-27）、厳格な米国政府規制により非米国民へのアクセスがブロックされ、Anthropic は同提供を一時的に終了し、後に Mythos を米国 100 機関へ再開放しました。その結果、業界は Qwen や Gemma といったローカルモデル、DeepSeek および GLM の API ベースの推論、脆弱性管理用の Strix ハーネスなどを含む代替アプローチへと転換しています。組織側も攻撃表面積を削減するため「distroless」コンテナを採用し、自動化された発見ツールに依存するのみではなく文脈に基づいて脆弱性を優先させるゼロトラスト原則を取り入れるなどしています。同時に、OpenAI も政府審査要件のためエクスプロイト構築よりも防衛を重視する「Daybreak」プロジェクトを含む GPT-5.5-Cyber、Codex Security プラグインの開発を進めています。さらに、セキュリティに焦点を当てた Sol、Terra、Luna の新しいモデルファミリーをリリースしており、これも同様に防御能力を優先しています。

CISOned 观点：重新思考神话（Mythos）模型带来的网络安全格局

随着围绕“神话（Mythos）”模型的恐惧、不确定性与怀疑（FUD）逐渐变为现实，我们需要如何应对？颇具讽刺意味的是，多年的安全实践几乎无需改变。

1. 现状分析：宣传与现实的差距

Anthropic 惯用戏剧化的措辞。Model "Mythos" 虽未全面发布，但其引发的"Project Glasswing"项目揭示了新的安全图景：

受限访问：模型权限仅开放给 50 家组织（后扩展至 150 家）。
突破性成果：英国政府人工智能安全研究所的评估报告显示，该模型首次成功完成“专家级任务”，并实现了攻击链中的"终极关卡"（从侦察到全面网络接管）。
漏洞发现能力：部分用户报告发现了数百个旧版漏洞，例如 OpenBSD 中 27 年前的漏洞和 FFmpeg 中 16 年前的漏洞。

现实挑战：基准测试与企业环境的脱节

尽管模型进步显著，但细读评估文章可发现实际情况远未如宣传那般戏剧化：

现有模型已具备实力：GPT-5.4 乃至 Opus 4.6 在高级 CTF（夺旗）挑战方面表现不相伯仲。
企业防御优势：拥有成熟网络安全计划和专用 SOC（安全运营中心） 的企业，其现实环境远超模型基准测试的覆盖范围。
攻击者特征：模型在执行侦察或横向移动时往往表现得十分嘈杂且笨拙。
缺乏防御机制：模型缺乏主动防御系统功能，执行高风险行为也不会受到即时惩罚。

关于“零日漏洞”与营销话术的辨析

针对"AI 能离线发现所有关键漏洞”的论调，网络安全专业人士应持理性态度：

CVE 公告技巧：强调漏洞的“年代久远”（如 27 年前的 CVE）通常是点击诱饵。开源产品拥有数十万行代码，存在旧漏洞并不罕见。
价值本质：旧漏洞的价值在于影响范围广，而非发现难度低。AI 辅助的发现将大幅增加这些漏洞的普遍性。
成本高昂：Anthropic Red Team 的博客指出，在数千个源代码文件上进行多次运行以发现 BSD 漏洞的成本约为 20,000 美元，整个项目 Token 预算高达一亿美元。

2. 技术局限与竞争格局

模型能力的边界

误报率问题：早期 AI 驱动漏洞狩猎的最大缺点是误报率高。虽然 Mozilla 和 Cloudflare 声称 Mythos 的误报率极低，但时间将揭示其真实性。若无此能力，组织将被淹没在安全噪声中。
利用代码生成：仅有 Mythos 级别的模型具备"发出警告且能证明可利用性"的能力。其他小体量 LLM（如 DeepSeek, Gemma 4, Qwen 3.6）虽能发现部分漏洞，但无法生成有效的利用代码。

市场反应与政府干预

美国政府的暂停令：美国政府禁止所有非美国公民（含美籍海内人员）访问 Mythos/Fable，迫使 Anthropic 彻底关闭服务。
OpenAI 的跟进：OpenAI 正推进 GPT-5.5-Cyber 与 Codex Security 插件，项目包括"Daybreak"和"Patch the Planet"。
- 策略调整：相比 Anthropic，OpenAI 进行了“回调”，专注于防御端，旨在避免激怒监管机构。
- 人为稀缺：平均公司无法访问 5.5-Cyber，而大型网络安全公司可获得后以溢价转售客户，这是一种披着“负责任部署”外衣的垄断行为。

3. 应对策略：我们要采取什么行动？

尽管普通人无法直接访问 Mythos 或 GPT-5.5-Cyber，但现有工具仍可有效利用（如 Strix 驾驭工具可结合本地模型或 API）。以下是核心行动指南：

1. 持续改进漏洞管理计划 (Vulnerability Management)

CVE 发布率稳步上升，修补时间必须短于武器化时间。关键在于做出明智选择：

分流与上下文优先化：利用 LLM 处理海量数据，分析漏洞对企业业务的实际重要性、访问难度及现有补偿措施，而非仅依赖供应商的“漏洞评分”。

2. 减少攻击面 (Reduce Attack Surface)

最佳防御是不在系统中拥有相关组件。

容器最小化：采用 Distroless 镜像。推荐方案：
- Google 原始项目
- DHI (Docker Hardened Images)
- Kubernetes 专用：Talos Linux
Windows 平台：启用 Server Core 等温和变体，禁用不必要的服务。

3. 为 LLM 防御体系增加更多安全层

实施纵深防御（Security-in-depth）以减缓入侵速度：

网络控制：在 VPN/网络分段中添加工感知的代理和特权访问管理网关。
身份验证：在所有登录尝试中使用防钓鱼 MFA。
诱饵系统：部署蜜罐（Honeypots）和金丝雀令牌（Canary Tokens）。AI 入侵模型往往行为笨拙且坦诚，极易触发此类陷阱。

4. 以零信任（Zero Trust）挽救局面

遵循“明确验证、最小权限、默认假定破坏已发生”的原则：

技术实施：利用工能感知的代理（ZTNA 网关），在获取目标系统视线前强制执行预先身份验证，阻断未经授权的远程代码执行（RCE）。
人员培训：针对 AI 生成的社会工程学攻击（如仿冒邮件、音视频）进行培训。明确验证对客服团队至关重要。

4. 总结与核心建议

Mythos 在网络安全领域的成就真实存在，特别是在生成有效利用代码方面。但进步是线性的，我们无需恐慌。应利用 Mythos 暂时不可用的窗口期重新整备：

切勿将 LLM 的独家使用权交给攻击者：利用 AI 服务于事件响应和安全审查代理。
提高修补时间效率：通过上下文感知优先化聚焦关键漏洞。
减少攻击面：修剪服务器镜像，强制执行零信任接入。
采纳零信任心态：假设破坏已发生，严格遵循最小权限原则。
设置陷阱：利用 LLM 的偏见和坦诚特性，诱捕并通知 SOC，将其转化为防御优势。

结论：Mythos 并未使现有网络安全优先级失效，但它显著提高了忽视这些优先级的代价。保持冷静，坚持基础安全实践，我们便能安然应对。

ミイソス後のサイバーセキュリティ：落ち着いて業務を継続しよう