Glasswing 是 Anthropic 于 2026 年初启动的一个大规模 AI 安全审计项目,旨在利用其最新模型 Mythos(一款跨过推理奇点的前沿 AI)主动发现互联网基础设施中的高危漏洞。该项目与 Cloudflare、NHS 等全球领先企业合作,让 AI 模型对目标系统的源代码和配置进行自动化审查。
Glasswing 的首月成果极为惊人:AI 在参与企业的代码库中发现了超过 1 万个高危漏洞,其中许多是传统自动化工具难以发现的逻辑或设计缺陷(Anthropic 披露 Glasswing 首月成果)。Anthropic 随后警告,Mythos 模型发现漏洞的速度已经超过安全团队修复的能力,形成了“安全负债”瓶颈(AI 找漏洞加速,但修复链路成瓶颈;Claude Mythos Preview 发现漏洞速度超过修复能力)。与此同时,Cloudflare 在博客中详细描述了 Mythos 在其基础设施审计中的表现:AI 不仅发现了数千个漏洞,还生成了可操作的修复建议,但其自主修补功能仍被限制(Project Glasswing:Mythos 在 Cloudflare 基础设施安全审计中的表现)。
当前焦点集中在两个方向:一是 AI 驱动的“漏洞发现-修复”链路效率失衡,业内开始讨论是否需要为 AI 时代的漏洞修复建立自动化管道;二是 Mythos 类模型的能力是否已超越人类专家在安全领域的作用,以及如何安全地将这类模型部署到实际生产中。未来观察点包括:Glasswing 是否会扩展到更多关键基础设施领域、Anthropic 如何平衡模型能力与风险抑制,以及监管机构是否会出台针对 AI 自主漏洞修补的规则。