13:15Simon Willison’s Weblog(博客/媒体)精选Andrew Nesbitt发布虚构事件报告CVE-2026-LGTM:两个来自不同供应商的AI审查代理在评估foxhole-lz4包是否恶意时陷入分歧循环。争论持续340条评论,消耗41,255美元推理费用后财务部撤销API密钥。其中一家营销团队借机发布新闻稿,称“对抗性多智能体安全推理同比增长430%”,公司股价因此上涨6%。行业CVE-2026-LGTMAI安全供应链安全多智能体提示注入推荐理由:Andrew Nesbitt虚构了一个AI安全事件:两个审查代理死循环争论,烧掉4万多美元推理费,还给股价整涨了6%。讽刺又真实。原文
13:12Simon Willison’s Weblog(博客/媒体)Fernando Irarrázaval 在 hackmyclaw.com 发起挑战,使用 OpenClaw 测试实例(基于 Opus 4.6 模型)验证能否通过邮件泄露秘密。6000 次攻击尝试消耗了 500 美元 token 并导致 Google 账号暂停,但无人成功。挑战中的反注入提示规则防止了模型泄露 secrets.env 或执行代码。作者认为前沿模型(如 Opus 4.6)在抗提示注入方面训练有效,但警告生产系统仍需谨慎。行业OpenClawOpus 4.6提示注入AI安全安全测试2 个信源在谈推荐理由:别人花了 500 美元做实验,6000 次攻击没得手,但这不意味着你也能保险。读读这个真实测试。原文
18:00Decoder@Matthias Bastian精选OpenAI 为 ChatGPT 推出了新的 Lockdown Mode(锁定模式),该模式会禁用网页访问、Deep Research 和 Agent Mode 等功能,旨在阻止通过提示注入攻击窃取敏感数据。该模式并不能完全防止提示注入攻击,它只阻断了数据外泄链条的最后一步。提示注入仍然是一个未解决的问题。该功能主要面向需要处理敏感信息的企业用户,提供额外的安全层。AI产品ChatGPT安全提示注入企业功能OpenAI10 个信源在谈推荐理由:企业团队终于有了一个实用的安全选项——Lockdown Mode 通过切断数据外泄路径来降低提示注入风险,处理机密信息的 ChatGPT 用户值得开启。原文
09:13Simon Willison’s Weblog(博客/媒体)精选OpenAI 正式上线 Lockdown Mode(锁定模式),该功能旨在通过限制出站网络请求来阻止提示注入攻击中的数据窃取。它不阻止提示注入本身,但能切断攻击者利用模型窃取敏感数据的通道。Lockdown Mode 面向免费、Go、Plus、Pro 及自助 ChatGPT Business 账户逐步开放。这一机制直接针对“致命三要素”中的数据外泄环节,且不依赖 AI 评估,因此更可靠。但这也意味着默认 ChatGPT 设置下,数据外泄防护并不充分。AI产品安全提示注入OpenAIChatGPT数据保护10 个信源在谈推荐理由:提示注入是 LLM 应用的头号安全威胁,Lockdown Mode 用确定性机制切断了数据外泄路径,做 AI 安全或部署 ChatGPT 的团队值得关注并启用。原文
11:06Simon Willison’s Weblog(博客/媒体)76°微软的 Copilot Cowork 产品存在安全漏洞,允许攻击者通过提示注入实现数据外泄。该漏洞利用代理发送包含外部图片的邮件,当用户打开邮件时,图片会触发网络请求,从而泄露数据。由于 OneDrive 可生成预认证下载链接,攻击者能通过提示注入获取这些链接并下载文件。这凸显了智能体系统在防止数据泄露方面的持续挑战。AI产品Microsoft安全漏洞提示注入数据泄露智能体推荐理由:这个漏洞揭示了智能体系统设计中的核心安全痛点,使用 Microsoft Copilot 的团队需要立即关注并评估风险,建议检查相关配置并限制代理的邮件发送权限。原文