全部 AI 动态 · AI 热点

6月16日

20:46

AITOP6月16日 20:46

600亿美元买下Cursor，xAI终于拿到了编程工具，但真正值得跟踪的或许不是AI

600亿美元买下Cursor，xAI终于拿到了编程工具，但真正值得跟踪的或许不是AI

6月12日

12:57

AITOP6月12日 12:57

Claude代码里藏了个20260612，18个月后的AI记忆革命已经开始倒计时

6月11日

15:28

AITOP6月11日 15:28

1107 vs 303：谷歌悄悄开源了一个“拆打字机”的模型，把大模型速度翻了4倍

15:23

AITOP6月11日 15:23

DiffusionGemma颠覆文本生成？自回归模型的“统治”要结束了

15:07

AITOP6月11日 15:07

每秒1107个token，Google开源的扩散模型为什么能改变本地推理格局？

6月4日

18:17

18:17

rohanpaul_ai@rohanpaul_ai

76°

Google DeepMind 最新论文首次系统分类了 6 种针对自主 AI 智能体的攻击类型，指出恶意网站可以检测到 AI 智能体并展示人类看不到的隐藏内容。这些攻击包括在 HTML 注释或白底白字文本中隐藏指令、图像像素隐写术、PDF 或元数据中的覆盖命令、跨会话持久化的记忆投毒、目标劫持以及多智能体设置中的级联攻击。论文强调，AI 智能体的真正安全问题不仅在于模型本身，更在于它所读取的环境——网络本身可以被武器化。在基准测试中，隐藏的提示注入在多达 86% 的场景中部分控制了智能体，子智能体劫持成功率 58-90%，数据外泄攻击在五种不同智能体架构中成功率超过 80%。

论文 AI 智能体安全/攻击提示注入记忆投毒 Google DeepMind

推荐理由：这篇论文戳破了「模型安全=一切安全」的幻觉，做自主智能体开发、RAG 系统或浏览器自动化工具的团队，建议认真看看攻击面到底在哪。