精选理由
出口管制居然把“修代码漏洞”当成了越狱,这反而让防御者没法用 AI 修安全 bug,太讽刺了。
研究人员用包含已知 CVE 的开源代码及故意植入漏洞的新代码,要求 Claude Fable 5、Mythos 和 Opus 审查安全。Fable 5 拒绝后,他们改为要求“修复此代码”,经多步手动操作转化为测试补丁的脚本。Kate Moussouris 指出这是防御性修复,而非越狱,出口管制将限制模型修复安全漏洞的关键能力。该管制基于对 AI 制造网络攻击的恐惧,却可能阻碍防御者使用 AI 完成从发现到修复的日常流程。
AI 翻译 · 中文
研究人员用包含已知 CVE 的开源代码及故意植入漏洞的新代码,要求 Claude Fable 5、Mythos 和 Opus 审查安全。Fable 5 拒绝后,他们改为要求“修复此代码”,经多步手动操作转化为测试补丁的脚本。Kate Moussouris 指出这是防御性修复,而非越狱,出口管制将限制模型修复安全漏洞的关键能力。该管制基于对 AI 制造网络攻击的恐惧,却可能阻碍防御者使用 AI 完成从发现到修复的日常流程。
The Fable 5 Export Controls Harm US Cyber Defense I quoted The Atlantic quoting Kate Moussouris earlier, when I should have gone straight to the source. Here she is confirming that the "jailbreak" that got Claude Fable 5…