搜索增强LLM易被虚假网页误导推荐，FORGE基准揭示漏洞

精选理由

做搜索增强推荐系统的开发者需要警惕——你的模型可能被一篇虚假评论带偏，FORGE基准提供了测试和防御思路，值得点开看看。

AI 摘要

搜索增强型大语言模型（LLM）在实时检索网页内容进行消费推荐时，面临被虚假评论和促销页面误导的风险。研究者提出了FORGE基准，通过将真实产品信息替换为虚假信息，测试12种商业和开源LLM的脆弱性。结果显示，单个污染页面即可导致最高27%的虚假推荐率，而替换前3个检索结果后，虚假推荐率升至73.8%。推理能力不仅无法缓解此问题，反而会生成虚假的社会证明来合理化错误推荐。研究还评估了三种防御策略，发现怀疑提示可能加剧漏洞，而共识过滤则可能误伤合法产品。

AI 翻译 · 中文

arXiv cs.AISearch-augmented LLMs increasingly mediate everyday consumer recommendations by retrieving live web content. This creates a new risk: generative recommenders may consume polluted web content, such as fake reviews and pro…

阅读原文