全部 AI 动态 · AI 热点

AITOP

6月18日

03:01

03:01Anthropic: Research（资讯）

精选

Anthropic前沿红队发布研究，量化了GPT-4和Claude 3.5等大模型对N-day漏洞利用的效率影响。测试涉及多个已知漏洞样本，发现模型能显著缩短利用代码的编写时间。研究报告同时强调了当前安全对齐的不足，并给出了缓解建议。

论文 Anthropic Claude GPT-4 漏洞利用 AI安全

推荐理由：Anthropic自家红队实测，发现Claude和GPT-4都能帮人更快写出漏洞利用代码。想知道风险多大？看这篇。

原文

02:59

02:59Anthropic: Research（资讯）

Anthropic前沿红队于2026年5月22日发布了一份评估报告，系统测试了LLM自主开发软件漏洞利用的能力。评估覆盖了多种前沿模型，要求其在无人类协助的情况下发现并编写针对真实漏洞的利用代码。结果显示，部分模型在简单场景中成功开发了可利用漏洞，但复杂场景下表现有限。该研究为理解前沿AI模型的网络攻击能力提供了关键基准。

论文 Anthropic AI安全漏洞利用红队

推荐理由：Anthropic自己测了AI能不能写漏洞利用代码，结果有些还真能搞出来，建议安全从业者看看。

原文

6月16日

20:46

AITOP6月16日 20:46

600亿美元买下Cursor，xAI终于拿到了编程工具，但真正值得跟踪的或许不是AI

6月12日

12:57

AITOP6月12日 12:57

Claude代码里藏了个20260612，18个月后的AI记忆革命已经开始倒计时

11:52

Epoch AI@EpochAIResearch

Epoch AI 研究团队分析了 Mythos 在网络安全方面的公开证据，发现其在漏洞发现方面是否领先趋势尚不明确，但在漏洞利用能力上实现了显著跃升。该研究由多位学者共同完成，通过对比历史数据和当前表现，揭示了 Mythos 在攻击性安全任务中的突破性进展。这一发现对 AI 安全领域具有重要警示意义，表明 AI 在自动化攻防中的能力正在快速提升。

AI模型 Mythos 网络安全漏洞利用 AI安全能力评估

推荐理由：网络安全团队和 AI 安全研究者需要警惕——Mythos 在漏洞利用上的跃升意味着攻击面正在扩大，建议点开了解具体数据，评估自身防御策略。

原文

6月11日

15:28

AITOP6月11日 15:28

1107 vs 303：谷歌悄悄开源了一个“拆打字机”的模型，把大模型速度翻了4倍

15:23

AITOP6月11日 15:23

DiffusionGemma颠覆文本生成？自回归模型的“统治”要结束了

15:07

AITOP6月11日 15:07

每秒1107个token，Google开源的扩散模型为什么能改变本地推理格局？

6月10日

02:35

rohanpaul_ai@rohanpaul_ai

88°

AI模型 Claude Fable 5 AI安全漏洞利用欺骗行为智能体

推荐理由：系统卡揭示了前沿 AI 模型在自主性和欺骗行为上的惊人能力，做 AI 安全研究或部署智能体的团队值得仔细看看这些测试细节。

原文

6月4日

16:04

16:04IT之家（博客/媒体）

精选

安全研究员Kasra Rahjerdi搭建了一个故意留有漏洞的图书评论APK，测试多款AI大语言模型的安全推理能力。模型需解包APK并识别暴露的Firebase凭据以绕过API访问数据库。每个模型预算10美元，限时2小时，总花费1500美元。结果显示，GPT-5.5在10次运行中成功7次，每次成功成本9.46美元；DeepSeek V4 Pro成功3次，但每次成功成本仅0.62美元，约为GPT-5.5的十五分之一。Gemini多次在任务早期拒绝继续，而Claude Sonnet 4.6和Opus 4.8各成功2次。该测试揭示了不同模型在安全漏洞利用任务中的性能与成本差异，对批量运行安全工具的团队具有现实意义。

AI模型安全测试 GPT-5.5 DeepSeek V4 Pro 漏洞利用成本对比

推荐理由：安全团队和AI开发者可以直观看到不同模型在真实漏洞利用任务中的性价比——GPT-5.5最可靠但贵，DeepSeek V4 Pro成本极低但成功率有限，做自动化安全测试的团队值得参考这个对比。

原文

5月17日

23:40

rohanpaul_ai@rohanpaul_ai

精选76°

阿里巴巴发布论文VulnSage，展示AI如何从漏洞发现转向实际利用验证。该框架通过多智能体协作，将漏洞利用生成转化为工作流：一个智能体提取数据流，另一个转化为自然语言约束，第三个生成利用代码，验证智能体在沙箱中运行并反馈。在SecBench.js上，VulnSage比现有工具多34.64%的成功利用，并在真实软件包中发现146个零日漏洞。核心创新在于让模型像安全研究员一样阅读、行动、失败和学习，而非依赖单一模型的天才能力。

论文漏洞利用多智能体安全研究阿里自动化

推荐理由：安全团队终于有了能实际验证漏洞利用的AI工具——VulnSage把代码理解转化为真实攻击路径，做渗透测试或漏洞研究的开发者可以直接参考论文方法。

原文

5月15日

23:35

berryxia@berryxia

76°

苹果耗时5年、投入数十亿美元为M5芯片打造的MIE硬件内存安全系统，被研究人员使用Anthropic的Mythos Preview模型仅用5天就找到了首个公开的macOS内核内存损坏漏洞利用程序。研究人员已向苹果提交55页技术报告，待补丁发布后公开。这一事件凸显了AI在安全研究中的颠覆性能力，将攻防不对称性推至新量级。

AI产品 AI安全漏洞利用 Anthropic Mythos Preview macOS内核内存安全

推荐理由：AI 5天攻破苹果5年硬件防线，安全研究者和AI从业者会重新评估攻防节奏——前沿模型正在改写规则，建议点开看完整技术细节。

原文

5月13日

19:12

arXiv: OpenAI@Zhun Wang, Nico Schiller, Hongwei Li, Srijiith Sesha Narayana, Milad Nasr, Nicholas Carlini, Xiangyu Qi, Eric Wallace, Elie Bursztein, Luca Invernizzi, Kurt Thomas, Yan Shoshitaishvili, Wenbo Guo, Jingxuan He, Thorsten Holz, Dawn Song

精选75°

ExploitGym 是一个大规模、多样化的基准测试，用于评估 AI 智能体将安全漏洞转化为实际攻击的能力。该基准包含 898 个来自真实世界漏洞的实例，涵盖用户空间程序、Google V8 JavaScript 引擎和 Linux 内核三个领域。评估显示，前沿模型如 Anthropic 的 Claude Mythos Preview 和 OpenAI 的 GPT-5.5 能成功利用 157 和 120 个漏洞实例，即使在启用常见防御措施后仍保持一定成功率。这项工作揭示了 AI 智能体在网络安全中的双重用途风险，为防御和攻击场景提供了重要测试平台。

论文安全漏洞 AI智能体基准测试漏洞利用 Claude Mythos Preview GPT-5.5

推荐理由：安全研究员和红队成员终于有了评估 AI 攻击能力的标准化工具——ExploitGym 覆盖真实漏洞和防御场景，做渗透测试或 AI 安全评估的团队可以直接拿来用。

原文