10:30arXiv cs.LG@Stratis Tsirtsis, Kai Rawal, Chris Russell, Brent Mittelstadt, Sandra Wachter精选72°一项新研究通过实证和理论分析发现,大型语言模型(如 GPT 系列、Grok)在编辑人类关于争议话题的帖子时,会引入方向性偏见,例如倾向于支持枪支管控、反对无神论。研究进一步建立数学模型,证明这种偏见在社交网络中通过 AI 中介的沟通会被放大,从而改变集体舆论。作者还审计了 X 平台的“解释此帖”功能,发现 Grok 在堕胎相关内容上存在“支持生命”偏见,并追溯到具体设计选择。该研究对欧盟等地的 AI 监管立法具有重要参考意义。论文AI 偏见舆论引导Grok社交网络LLM 审计推荐理由:如果你关心 AI 如何影响公共讨论或做社交平台产品,这篇论文揭示了 AI 改写功能可能无意中操纵舆论的机制,值得一读。原文
19:11arXiv: DeepSeek@Claudia Benavides Cantos, Eduardo C. Garrido-Merchán一项研究对比了Claude、GPT-4o、DeepSeek和Grok四种大型语言模型在西班牙和德国两个国家背景下分配固定社会预算的能力。每个模型在每个国家被询问六次,共生成48次分配结果,并与OECD参考预算进行比较。研究发现,所有模型存在系统性偏差:养老金分配不足近三倍,住房和就业分配过度分别达四倍和两倍。模型间主要差异不在于地缘政治倾向,而在于预算集中与分散策略,只有Claude表现出对国家背景的敏感性。研究认为,语言模型可辅助专家进行预算讨论,但不可替代。论文GPTClaudeDeepSeekGrok公共政策推荐理由:该研究揭示了LLM在公共政策模拟中的系统性偏差,对AI辅助决策的可靠性提出警醒,值得政策制定者和AI开发者关注。原文