全部 AI 动态 · AI 热点

6月28日

10:49

10:49

Guillermo Rauch@rauchg

智谱AI发布的新模型在安全漏洞发现任务中与Claude Mythos性能相当。该模型可搭配deepsec等工具进行自动化漏洞扫描。如果对手获得类似攻击能力，可能对美国公司构成严重威胁。

AI模型 Zhipu AI Claude Mythos 安全漏洞漏洞发现

推荐理由：智谱AI新模型找漏洞能力不输Claude Mythos，做安全的小伙伴快试试！

6月18日

10:42

10:42

arXiv cs.LG@Nahum Korda, Gadi Evron

OpenAnt是一个开源漏洞发现系统，将静态程序分析与大语言模型推理结合，采用多阶段流水线。它通过代码分解将分析面减少97%，仅保留从外部入口可达的攻击相关代码。系统通过对抗验证模拟攻击者能力评估可利用性，并自动生成动态验证环境在沙箱容器中执行。在OpenSSL、WordPress和Flowise等开源项目评估中，OpenAnt识别了之前未知的漏洞，同时大幅降低误报率。

论文 OpenAnt LLM 漏洞发现代码安全开源项目

推荐理由：OpenAnt把LLM和静态分析结合起来做漏洞挖掘，在三个知名开源项目里发现了新漏洞，误报还少，值得做安全的看看。

6月16日

20:46

AITOP6月16日 20:46

600亿美元买下Cursor，xAI终于拿到了编程工具，但真正值得跟踪的或许不是AI

600亿美元买下Cursor，xAI终于拿到了编程工具，但真正值得跟踪的或许不是AI

6月12日

12:57

AITOP6月12日 12:57

Claude代码里藏了个20260612，18个月后的AI记忆革命已经开始倒计时

6月11日

15:28

AITOP6月11日 15:28

1107 vs 303：谷歌悄悄开源了一个“拆打字机”的模型，把大模型速度翻了4倍

15:23

AITOP6月11日 15:23

DiffusionGemma颠覆文本生成？自回归模型的“统治”要结束了

15:07

AITOP6月11日 15:07

每秒1107个token，Google开源的扩散模型为什么能改变本地推理格局？

5月26日

11:50

11:50

arXiv: Anthropic@Alfredo Pesoli, Herman Errico, Lorenzo Cavallaro

精选

本文从“漏洞经济学”视角分析LLM驱动的漏洞发现对攻防格局的影响。传统上，高端零日漏洞是政府、经纪商和攻击性厂商的昂贵专业产出，而LLM辅助系统降低了候选漏洞生成、代码理解、验证报告等环节的成本。这导致瓶颈从“发现更多漏洞”转向“吸收、验证、分类、修补和发布大量报告”。基于Anthropic Mythos Preview与Mozilla Firefox合作数据，论文指出近期变化不是更多零日漏洞，而是防御者修复吞吐量的提升：低信号候选漏洞变便宜，证据丰富的修复更重要，稀缺能力转向维护者审查和发布。开源项目受影响最严重，因为LLM辅助发现可增加报告量，但维护者验证、分类、资金和发布能力可能无法同步扩展。

论文 LLM 漏洞发现安全经济学零日漏洞修复吞吐量

推荐理由：这篇论文戳破了“AI将颠覆安全攻防”的简单叙事，用经济学框架解释了为什么防御者才是LLM漏洞发现的真正受益方。做安全运营、开源维护或漏洞奖励计划的人，看完会重新理解自己的瓶颈在哪。

5月23日

11:05

11:05

岚叔@lufzzliz

83°

Anthropic 发布 Project Glasswing 更新，显示 AI 在漏洞发现上取得突破：与 50 个合作伙伴用 Claude Mythos Preview 发现超 1 万个高危/严重漏洞，Cloudflare 扫出 400 个高危，Mozilla 修复 Firefox 150 中 271 个漏洞。AI 也能快速生成补丁，Claude Security 三周内帮企业修了 2100 多个漏洞。但真正的瓶颈在于从发现到部署的整条链路——复现、确认、写补丁、合并、发版、用户升级等环节仍按人类速度运转。开源生态尤其脆弱，维护者被 AI 生成的低质量报告淹没，甚至要求放慢披露。这导致一个尴尬窗口期：漏洞发现和攻击学习加速，但修复部署跟不上。长期看 AI 将提升软件安全，但短期需要更高吞吐量的漏洞处理系统。

行业漏洞发现 AI 安全 Anthropic Claude 开源生态

推荐理由：安全团队和开源维护者会直接感受到压力——AI 发现漏洞的速度远超人类处理能力，点开看看如何应对这个尴尬窗口期。

5月19日

10:26

10:26

arXiv: Anthropic@Isaac David, Arthur Gervais

精选

Anthropic在2026年4月发布的Mythos材料中声称其模型能发现真实漏洞，但本文通过控制实验复现了这些漏洞发现任务。实验让GPT-5.5、Claude Opus 4.7和Kimi K2在给定目标文件、只读源码和手动匹配规则下，尝试复现6个已知漏洞。结果显示，GPT-5.5在54次尝试中仅成功5次（覆盖2/6任务），Claude Opus 4.7成功1次，Kimi K2为0次。主要失败原因是模型过早锁定看似合理的候选错误，而忽略了补丁证据中的具体不变性。该结果不否定Anthropic未公开的工作流程，但表明在有利的靶标文件框架下，系统特定提示仅产生少量匹配。

论文漏洞发现基准测试 GPT-5.5 Claude Opus 4.7 Kimi K2

推荐理由：这个实验戳破了AI漏洞发现能力的泡沫——即使给定了目标文件，顶级模型复现已知漏洞的成功率也极低。做AI安全评估或漏洞研究的团队，看完会重新审视benchmark的可靠性。

5月18日

13:37

13:37IT之家（博客/媒体）

据《金融时报》报道，Anthropic 已同意向金融稳定委员会（FSB）简报其 AI 模型 Mythos 发现的全球金融体系网络防御漏洞。Mythos 是 Anthropic 于今年 4 月发布的前沿 AI 模型，用于网络防御，已在操作系统、浏览器等软件中发现数千个重大漏洞。英国央行行长贝利警告该模型可能构成重大网络安全威胁。FSB 正起草关于金融体系应用 AI 的稳健实践报告，计划下月发布征求意见。

行业 Anthropic Mythos 网络防御金融监管漏洞发现

推荐理由：金融安全领域首次有 AI 模型直接向全球监管机构报告漏洞，做网络安全或金融风控的从业者值得关注——这可能是 AI 改变监管范式的信号。

5月12日

19:11

19:11

arXiv: Anthropic@Michael A. Riegler, Inga Strümke

75°

研究者开发了开源对抗测试框架swarm-attack，利用多个1.2B参数轻量级LLM通过共享内存、并行探索和进化优化协同工作。对GPT-4o的越狱攻击有效危害率达45.8%，产生49个严重漏洞，而对Claude Sonnet-4成功率为0%。在软件漏洞发现实验中也以100%召回率在4分钟内复现了9个CWE漏洞，表明此前需限制发布的能力可在零成本下复现，关键因素是系统框架本身补偿了小模型的推理限制。

论文 AI安全多智能体/协同越狱攻击漏洞发现开源/仓库

推荐理由：该研究揭示了AI安全政策应聚焦系统而非模型本身，因为小模型通过协调框架即可实现高危险能力，这对当前以模型为中心的安全管控思路提出了重要挑战。

5月11日

11:18

11:18

Ethan Mollick@emollick

作者意识到“Mythos作为炒作”对不同群体有不同含义。对于业内人，Mythos并非AI能力的魔法飞跃；对外行人，它意味着Mythos未能真正发现零日漏洞。后者是错的，而前者很可能是对的。这反映了AI炒作中信息的断层。

行业 AI安全 Mythos 炒作漏洞发现行业认知

推荐理由：指出Mythos在AI安全领域被内外行误解的双重现象，对理解行业炒作与真实能力差异有参考价值。