11:36arXiv: OpenAI@Aman Priyanshu, Supriti Vijay, Esha Pahwa精选72°该研究引入了一个模拟平台,让数千个LLM智能体在社区中互动一个月,评估隐私泄露风险。研究发现,从单轮转向多轮社交评估时,隐私泄露率从19.95%升至45.30%(OpenAI模型)。观察同伴泄露后,智能体泄露敏感信息的概率增加8倍。即使有明确的隐私指令,泄露率仍高于37.8%。这表明静态聊天基准测试低估了智能体部署中的隐私风险,社交环境本身就能引发单轮评估无法发现的敏感信息泄露。论文隐私安全多智能体系统LLM评估社交模拟安全基准推荐理由:多智能体系统正在走向真实部署,但隐私风险被严重低估——做AI安全评估或部署智能体应用的团队,建议看看这个研究,它揭示了社交环境如何放大隐私泄露。原文