AITP
精选全部 AI 动态AI 日报Agent 接入关于更新日志信源提报反馈
登录 / 注册
AITOP
全部 AI 动态
AI 相关资讯全量信息流
全部博客资讯推文论文
全部模型产品行业论文技巧
标签:提示注入×
6月27日
13:15
13:15Simon Willison’s Weblog(博客/媒体)
精选
Andrew Nesbitt发布虚构事件报告CVE-2026-LGTM:两个来自不同供应商的AI审查代理在评估foxhole-lz4包是否恶意时陷入分歧循环。争论持续340条评论,消耗41,255美元推理费用后财务部撤销API密钥。其中一家营销团队借机发布新闻稿,称“对抗性多智能体安全推理同比增长430%”,公司股价因此上涨6%。
行业CVE-2026-LGTMAI安全供应链安全多智能体提示注入

推荐理由:Andrew Nesbitt虚构了一个AI安全事件:两个审查代理死循环争论,烧掉4万多美元推理费,还给股价整涨了6%。讽刺又真实。
原文
13:12
13:12Simon Willison’s Weblog(博客/媒体)
Fernando Irarrázaval 在 hackmyclaw.com 发起挑战,使用 OpenClaw 测试实例(基于 Opus 4.6 模型)验证能否通过邮件泄露秘密。6000 次攻击尝试消耗了 500 美元 token 并导致 Google 账号暂停,但无人成功。挑战中的反注入提示规则防止了模型泄露 secrets.env 或执行代码。作者认为前沿模型(如 Opus 4.6)在抗提示注入方面训练有效,但警告生产系统仍需谨慎。
行业OpenClawOpus 4.6提示注入AI安全安全测试

推荐理由:别人花了 500 美元做实验,6000 次攻击没得手,但这不意味着你也能保险。读读这个真实测试。
原文
6月16日
20:46
AITOP6月16日 20:46
600亿美元买下Cursor,xAI终于拿到了编程工具,但真正值得跟踪的或许不是AI600亿美元买下Cursor,xAI终于拿到了编程工具,但真正值得跟踪的或许不是AI
6月12日
12:57
AITOP6月12日 12:57
Claude代码里藏了个20260612,18个月后的AI记忆革命已经开始倒计时
6月11日
15:28
AITOP6月11日 15:28
1107 vs 303:谷歌悄悄开源了一个“拆打字机”的模型,把大模型速度翻了4倍
15:23
AITOP6月11日 15:23
DiffusionGemma颠覆文本生成?自回归模型的“统治”要结束了
15:07
AITOP6月11日 15:07
每秒1107个token,Google开源的扩散模型为什么能改变本地推理格局?
6月7日
18:00
18:00Decoder@Matthias Bastian
精选
OpenAI 为 ChatGPT 推出了新的 Lockdown Mode(锁定模式),该模式会禁用网页访问、Deep Research 和 Agent Mode 等功能,旨在阻止通过提示注入攻击窃取敏感数据。该模式并不能完全防止提示注入攻击,它只阻断了数据外泄链条的最后一步。提示注入仍然是一个未解决的问题。该功能主要面向需要处理敏感信息的企业用户,提供额外的安全层。
AI产品ChatGPT安全提示注入企业功能OpenAI

推荐理由:企业团队终于有了一个实用的安全选项——Lockdown Mode 通过切断数据外泄路径来降低提示注入风险,处理机密信息的 ChatGPT 用户值得开启。
原文
6月6日
09:13
09:13Simon Willison’s Weblog(博客/媒体)
精选
OpenAI 正式上线 Lockdown Mode(锁定模式),该功能旨在通过限制出站网络请求来阻止提示注入攻击中的数据窃取。它不阻止提示注入本身,但能切断攻击者利用模型窃取敏感数据的通道。Lockdown Mode 面向免费、Go、Plus、Pro 及自助 ChatGPT Business 账户逐步开放。这一机制直接针对“致命三要素”中的数据外泄环节,且不依赖 AI 评估,因此更可靠。但这也意味着默认 ChatGPT 设置下,数据外泄防护并不充分。
AI产品安全提示注入OpenAIChatGPT数据保护

推荐理由:提示注入是 LLM 应用的头号安全威胁,Lockdown Mode 用确定性机制切断了数据外泄路径,做 AI 安全或部署 ChatGPT 的团队值得关注并启用。
原文
5月27日
11:06
11:06Simon Willison’s Weblog(博客/媒体)
76°
微软的 Copilot Cowork 产品存在安全漏洞,允许攻击者通过提示注入实现数据外泄。该漏洞利用代理发送包含外部图片的邮件,当用户打开邮件时,图片会触发网络请求,从而泄露数据。由于 OneDrive 可生成预认证下载链接,攻击者能通过提示注入获取这些链接并下载文件。这凸显了智能体系统在防止数据泄露方面的持续挑战。
AI产品Microsoft安全漏洞提示注入数据泄露智能体

推荐理由:这个漏洞揭示了智能体系统设计中的核心安全痛点,使用 Microsoft Copilot 的团队需要立即关注并评估风险,建议检查相关配置并限制代理的邮件发送权限。
原文
精选全部日报登录