AITP
精选全部 AI 动态AI 日报Agent 接入关于更新日志信源提报反馈
登录 / 注册
AITOP
全部 AI 动态
AI 相关资讯全量信息流
全部博客资讯推文论文
全部模型产品行业论文技巧
标签:漏洞发现×
6月28日
10:49
10:49Guillermo Rauch@rauchg
智谱AI发布的新模型在安全漏洞发现任务中与Claude Mythos性能相当。该模型可搭配deepsec等工具进行自动化漏洞扫描。如果对手获得类似攻击能力,可能对美国公司构成严重威胁。
AI模型Zhipu AIClaude Mythos安全漏洞漏洞发现

推荐理由:智谱AI新模型找漏洞能力不输Claude Mythos,做安全的小伙伴快试试!
原文
6月18日
10:42
10:42arXiv cs.LG@Nahum Korda, Gadi Evron
OpenAnt是一个开源漏洞发现系统,将静态程序分析与大语言模型推理结合,采用多阶段流水线。它通过代码分解将分析面减少97%,仅保留从外部入口可达的攻击相关代码。系统通过对抗验证模拟攻击者能力评估可利用性,并自动生成动态验证环境在沙箱容器中执行。在OpenSSL、WordPress和Flowise等开源项目评估中,OpenAnt识别了之前未知的漏洞,同时大幅降低误报率。
论文OpenAntLLM漏洞发现代码安全开源项目

推荐理由:OpenAnt把LLM和静态分析结合起来做漏洞挖掘,在三个知名开源项目里发现了新漏洞,误报还少,值得做安全的看看。
原文
6月16日
20:46
AITOP6月16日 20:46
600亿美元买下Cursor,xAI终于拿到了编程工具,但真正值得跟踪的或许不是AI600亿美元买下Cursor,xAI终于拿到了编程工具,但真正值得跟踪的或许不是AI
6月12日
12:57
AITOP6月12日 12:57
Claude代码里藏了个20260612,18个月后的AI记忆革命已经开始倒计时
6月11日
15:28
AITOP6月11日 15:28
1107 vs 303:谷歌悄悄开源了一个“拆打字机”的模型,把大模型速度翻了4倍
15:23
AITOP6月11日 15:23
DiffusionGemma颠覆文本生成?自回归模型的“统治”要结束了
15:07
AITOP6月11日 15:07
每秒1107个token,Google开源的扩散模型为什么能改变本地推理格局?
5月26日
11:50
11:50arXiv: Anthropic@Alfredo Pesoli, Herman Errico, Lorenzo Cavallaro
精选
本文从“漏洞经济学”视角分析LLM驱动的漏洞发现对攻防格局的影响。传统上,高端零日漏洞是政府、经纪商和攻击性厂商的昂贵专业产出,而LLM辅助系统降低了候选漏洞生成、代码理解、验证报告等环节的成本。这导致瓶颈从“发现更多漏洞”转向“吸收、验证、分类、修补和发布大量报告”。基于Anthropic Mythos Preview与Mozilla Firefox合作数据,论文指出近期变化不是更多零日漏洞,而是防御者修复吞吐量的提升:低信号候选漏洞变便宜,证据丰富的修复更重要,稀缺能力转向维护者审查和发布。开源项目受影响最严重,因为LLM辅助发现可增加报告量,但维护者验证、分类、资金和发布能力可能无法同步扩展。
论文LLM漏洞发现安全经济学零日漏洞修复吞吐量

推荐理由:这篇论文戳破了“AI将颠覆安全攻防”的简单叙事,用经济学框架解释了为什么防御者才是LLM漏洞发现的真正受益方。做安全运营、开源维护或漏洞奖励计划的人,看完会重新理解自己的瓶颈在哪。
原文
5月23日
11:05
11:05岚叔@lufzzliz
83°
Anthropic 发布 Project Glasswing 更新,显示 AI 在漏洞发现上取得突破:与 50 个合作伙伴用 Claude Mythos Preview 发现超 1 万个高危/严重漏洞,Cloudflare 扫出 400 个高危,Mozilla 修复 Firefox 150 中 271 个漏洞。AI 也能快速生成补丁,Claude Security 三周内帮企业修了 2100 多个漏洞。但真正的瓶颈在于从发现到部署的整条链路——复现、确认、写补丁、合并、发版、用户升级等环节仍按人类速度运转。开源生态尤其脆弱,维护者被 AI 生成的低质量报告淹没,甚至要求放慢披露。这导致一个尴尬窗口期:漏洞发现和攻击学习加速,但修复部署跟不上。长期看 AI 将提升软件安全,但短期需要更高吞吐量的漏洞处理系统。
行业漏洞发现AI 安全AnthropicClaude开源生态

推荐理由:安全团队和开源维护者会直接感受到压力——AI 发现漏洞的速度远超人类处理能力,点开看看如何应对这个尴尬窗口期。
原文
5月19日
10:26
10:26arXiv: Anthropic@Isaac David, Arthur Gervais
精选
Anthropic在2026年4月发布的Mythos材料中声称其模型能发现真实漏洞,但本文通过控制实验复现了这些漏洞发现任务。实验让GPT-5.5、Claude Opus 4.7和Kimi K2在给定目标文件、只读源码和手动匹配规则下,尝试复现6个已知漏洞。结果显示,GPT-5.5在54次尝试中仅成功5次(覆盖2/6任务),Claude Opus 4.7成功1次,Kimi K2为0次。主要失败原因是模型过早锁定看似合理的候选错误,而忽略了补丁证据中的具体不变性。该结果不否定Anthropic未公开的工作流程,但表明在有利的靶标文件框架下,系统特定提示仅产生少量匹配。
论文漏洞发现基准测试GPT-5.5Claude Opus 4.7Kimi K2

推荐理由:这个实验戳破了AI漏洞发现能力的泡沫——即使给定了目标文件,顶级模型复现已知漏洞的成功率也极低。做AI安全评估或漏洞研究的团队,看完会重新审视benchmark的可靠性。
原文
5月18日
13:37
13:37IT之家(博客/媒体)
据《金融时报》报道,Anthropic 已同意向金融稳定委员会(FSB)简报其 AI 模型 Mythos 发现的全球金融体系网络防御漏洞。Mythos 是 Anthropic 于今年 4 月发布的前沿 AI 模型,用于网络防御,已在操作系统、浏览器等软件中发现数千个重大漏洞。英国央行行长贝利警告该模型可能构成重大网络安全威胁。FSB 正起草关于金融体系应用 AI 的稳健实践报告,计划下月发布征求意见。
行业AnthropicMythos网络防御金融监管漏洞发现

推荐理由:金融安全领域首次有 AI 模型直接向全球监管机构报告漏洞,做网络安全或金融风控的从业者值得关注——这可能是 AI 改变监管范式的信号。
原文
5月12日
19:11
19:11arXiv: Anthropic@Michael A. Riegler, Inga Strümke
75°
研究者开发了开源对抗测试框架swarm-attack,利用多个1.2B参数轻量级LLM通过共享内存、并行探索和进化优化协同工作。对GPT-4o的越狱攻击有效危害率达45.8%,产生49个严重漏洞,而对Claude Sonnet-4成功率为0%。在软件漏洞发现实验中也以100%召回率在4分钟内复现了9个CWE漏洞,表明此前需限制发布的能力可在零成本下复现,关键因素是系统框架本身补偿了小模型的推理限制。
论文AI安全多智能体/协同越狱攻击漏洞发现开源/仓库

推荐理由:该研究揭示了AI安全政策应聚焦系统而非模型本身,因为小模型通过协调框架即可实现高危险能力,这对当前以模型为中心的安全管控思路提出了重要挑战。
原文
5月11日
11:18
11:18Ethan Mollick@emollick
作者意识到“Mythos作为炒作”对不同群体有不同含义。对于业内人,Mythos并非AI能力的魔法飞跃;对外行人,它意味着Mythos未能真正发现零日漏洞。后者是错的,而前者很可能是对的。这反映了AI炒作中信息的断层。
行业AI安全Mythos炒作漏洞发现行业认知

推荐理由:指出Mythos在AI安全领域被内外行误解的双重现象,对理解行业炒作与真实能力差异有参考价值。
原文
精选全部日报登录