ExploitGym：AI智能体能否将安全漏洞转化为真实攻击？

精选理由

安全研究员和红队成员终于有了评估 AI 攻击能力的标准化工具——ExploitGym 覆盖真实漏洞和防御场景，做渗透测试或 AI 安全评估的团队可以直接拿来用。

AI 摘要

ExploitGym 是一个大规模、多样化的基准测试，用于评估 AI 智能体将安全漏洞转化为实际攻击的能力。该基准包含 898 个来自真实世界漏洞的实例，涵盖用户空间程序、Google V8 JavaScript 引擎和 Linux 内核三个领域。评估显示，前沿模型如 Anthropic 的 Claude Mythos Preview 和 OpenAI 的 GPT-5.5 能成功利用 157 和 120 个漏洞实例，即使在启用常见防御措施后仍保持一定成功率。这项工作揭示了 AI 智能体在网络安全中的双重用途风险，为防御和攻击场景提供了重要测试平台。

AI 翻译 · 中文

arXiv: OpenAIAI agents are rapidly gaining capabilities that could significantly reshape cybersecurity, making rigorous evaluation urgent. A critical capability is exploitation: turning a vulnerability, which is not yet an attack, in…

IT之家05-15 00:14原文
Anthropic: Engineering05-12 22:33原文
The Rundown AI05-13 01:11原文
Guillermo Rauch05-13 21:15原文
向阳乔木05-14 02:56原文
shao__meng05-14 05:27原文
OpenAI Blog05-15 00:00原文
Shashikant Kore05-12 09:35原文
岚叔05-12 09:35原文
Claude: Blog05-12 16:33原文

阅读原文