10:30arXiv cs.LG@Stratis Tsirtsis, Kai Rawal, Chris Russell, Brent Mittelstadt, Sandra Wachter精选72°一项新研究通过实证和理论分析发现,大型语言模型(如 GPT 系列、Grok)在编辑人类关于争议话题的帖子时,会引入方向性偏见,例如倾向于支持枪支管控、反对无神论。研究进一步建立数学模型,证明这种偏见在社交网络中通过 AI 中介的沟通会被放大,从而改变集体舆论。作者还审计了 X 平台的“解释此帖”功能,发现 Grok 在堕胎相关内容上存在“支持生命”偏见,并追溯到具体设计选择。该研究对欧盟等地的 AI 监管立法具有重要参考意义。论文AI 偏见舆论引导Grok社交网络LLM 审计推荐理由:如果你关心 AI 如何影响公共讨论或做社交平台产品,这篇论文揭示了 AI 改写功能可能无意中操纵舆论的机制,值得一读。原文