Mythos漏洞复现基准测试：GPT-5.5仅5/18成功

精选理由

这个实验戳破了AI漏洞发现能力的泡沫——即使给定了目标文件，顶级模型复现已知漏洞的成功率也极低。做AI安全评估或漏洞研究的团队，看完会重新审视benchmark的可靠性。

AI 摘要

Anthropic在2026年4月发布的Mythos材料中声称其模型能发现真实漏洞，但本文通过控制实验复现了这些漏洞发现任务。实验让GPT-5.5、Claude Opus 4.7和Kimi K2在给定目标文件、只读源码和手动匹配规则下，尝试复现6个已知漏洞。结果显示，GPT-5.5在54次尝试中仅成功5次（覆盖2/6任务），Claude Opus 4.7成功1次，Kimi K2为0次。主要失败原因是模型过早锁定看似合理的候选错误，而忽略了补丁证据中的具体不变性。该结果不否定Anthropic未公开的工作流程，但表明在有利的靶标文件框架下，系统特定提示仅产生少量匹配。

AI 翻译 · 中文

arXiv: AnthropicAnthropic's April 2026 Mythos materials combine benchmark claims with concrete bug-finding stories across OpenBSD, FreeBSD, Linux, FFmpeg, and browsers. This paper reports a controlled target-file rediscovery experiment …

berryxia05-16 23:32原文
TestingCatalog05-16 23:25原文
IT之家05-18 04:45原文
歸藏(guizang.ai)05-15 15:06原文
Matt Wolfe05-15 19:43原文
Geek05-16 12:11原文
rohanpaul_ai05-17 07:22原文
岚叔05-17 16:35原文
向阳乔木05-18 05:48原文
AI Will05-18 07:46原文

阅读原文