Glasswing

§ 01综述

Glasswing 是 Anthropic 于 2026 年初启动的一个大规模 AI 安全审计项目，旨在利用其最新模型 Mythos（一款跨过推理奇点的前沿 AI）主动发现互联网基础设施中的高危漏洞。该项目与 Cloudflare、NHS 等全球领先企业合作，让 AI 模型对目标系统的源代码和配置进行自动化审查。

Glasswing 的首月成果极为惊人：AI 在参与企业的代码库中发现了超过 1 万个高危漏洞，其中许多是传统自动化工具难以发现的逻辑或设计缺陷（Anthropic 披露 Glasswing 首月成果）。Anthropic 随后警告，Mythos 模型发现漏洞的速度已经超过安全团队修复的能力，形成了“安全负债”瓶颈（AI 找漏洞加速，但修复链路成瓶颈；Claude Mythos Preview 发现漏洞速度超过修复能力）。与此同时，Cloudflare 在博客中详细描述了 Mythos 在其基础设施审计中的表现：AI 不仅发现了数千个漏洞，还生成了可操作的修复建议，但其自主修补功能仍被限制（Project Glasswing：Mythos 在 Cloudflare 基础设施安全审计中的表现）。

当前焦点集中在两个方向：一是 AI 驱动的“漏洞发现-修复”链路效率失衡，业内开始讨论是否需要为 AI 时代的漏洞修复建立自动化管道；二是 Mythos 类模型的能力是否已超越人类专家在安全领域的作用，以及如何安全地将这类模型部署到实际生产中。未来观察点包括：Glasswing 是否会扩展到更多关键基础设施领域、Anthropic 如何平衡模型能力与风险抑制，以及监管机构是否会出台针对 AI 自主漏洞修补的规则。

§ 02相关报道10 条在档

§ 03邻近话题