11:03arXiv cs.AI@Sadia Asif, Mohammad Mohammadi Amiri, Momin Abbas, Prasanna Sattigeri, Karthikeyan Natesan Ramamurthy精选基于大语言模型的多智能体系统常通过中间通信协调任务,其中通过Transformer的KV缓存进行潜在通信能提升效率并保留更丰富的任务相关信息。但KV缓存会编码上下文输入、中间推理状态和智能体特定信息,形成不透明通道,可能导致敏感内容在智能体间传播而无需显式文本披露。为此,研究者提出LCGuard框架,将共享KV缓存视为潜在工作记忆,在缓存工件传输前学习表示级变换。通过对抗训练形式化敏感信息泄露:若对抗解码器能从共享缓存中恢复智能体特定敏感输入,则视为不安全。实验表明,LCGuard在多个模型家族和多智能体基准上持续降低基于重建的泄露和攻击成功率,同时保持与标准KV共享基线相当的任务性能。论文多智能体系统KV缓存安全/隐私对抗训练LCGuard推荐理由:多智能体系统开发者终于有了保护KV缓存中隐式敏感信息的方案——LCGuard在不牺牲任务性能的前提下阻断信息重建攻击,做分布式AI协作的团队值得关注。原文
09:59arXiv cs.AI@William Lugoloobi, Samuelle Marro, Jabez Magomere, Joss Wright, Chris Russell精选研究人员发现,基于LLM的浏览器代理在网页上执行任务时,其操作序列和交互时间可以被被动JavaScript追踪器捕获,从而以高达96%的F1分数识别出底层模型。该研究覆盖了14个前沿LLM和四个网页环境,包括信息检索和购物任务。攻击者可以利用此漏洞针对已知模型漏洞发起定向攻击。虽然注入随机时间延迟可以降低分类器性能,但重新训练后仍能恢复大部分识别能力。研究团队已发布相关工具和标注数据集。论文LLM代理安全/隐私指纹识别浏览器自动化模型漏洞推荐理由:这项研究揭示了LLM代理的一个重大安全风险——网站可以被动识别你的AI模型,做AI安全和隐私保护的团队值得关注,建议开发者检查自己的代理是否容易通过UI痕迹被指纹识别。原文