12:59arXiv: Anthropic@Will Jack, Noah Lehman, Keller Maloney, Sarah Xu精选一项针对AI助手品牌推荐的审计研究发现,当用户以不同身份(如初创创始人、企业VP、英国中小企业主)询问“最佳CRM软件”时,模型推荐的品牌集差异显著。在2000次测试中,角色前缀使推荐集相似度下降12-20%,且影响集中在二线品牌(更换率高达75%),而头部品牌几乎不受影响。Anthropic的Sonnet模型比OpenAI更依赖训练数据先验,其推荐中43-52%无检索证据支撑(OpenAI仅8-29%),因此角色影响更大。研究警告,任何AI品牌感知测量都必须考虑用户角色,否则会掩盖真实偏差。论文品牌推荐用户角色AnthropicOpenAI检索增强10 个信源在谈推荐理由:做AI产品评测或品牌策略的团队会发现,用户画像对推荐结果的影响比想象中大得多——Anthropic的模型尤其容易“看人下菜碟”,建议点开了解如何避免测量偏差。原文