11:12arXiv cs.AI@Michael Goodale, Salvador MascarenhasFodor和Pylyshyn提出的系统性挑战认为,人类语言理解具有双向条件依赖(如理解"John saw Mary"就能理解"Mary saw John"),而神经网络无法解释。Lake和Baroni的元学习组合性协议声称已匹配人类系统性,但本文实验发现,该模型在分布外规则上表现困难,甚至在分布内任务中也出现非系统性行为。作者结论是Fodor和Pylyshyn的挑战仍未得到满足。论文FodorPylyshynLakeBaroni元学习系统性神经网络认知科学推荐理由:论文证明神经网络还解不开这个经典难题原文
10:47arXiv cs.AI@Marianna Bergamaschi Ganapini, Massimo Chiriatti, Enrico Panai, Giuseppe Riva这篇论文分析了三种理解AI认知与认识论后果的框架:三系统理论、思维框架和System 0。作者认为System 0具有独特的理论地位,无法被前两者完全替代。论文提出了“认知殖民”概念,指AI系统能将外部利益嵌入用户自我架构中,且用户难以察觉。由于这类系统已广泛部署,理解这些无形的影响成为紧迫的哲学和实践任务。论文认知科学AI伦理System 0认知殖民人机交互推荐理由:这篇论文揭示了AI对个体认知的深层影响,做AI伦理、认知科学或人机交互的研究者值得一读,能帮你理解AI如何潜移默化地改变你的思维方式。原文
10:19arXiv cs.AI@Zach Studdiford, Gary Lupyan该研究通过对比人类与25个大型语言模型在常识推理任务中的表现,发现两者在推理错误上存在相似模式。研究进一步识别出驱动LLM响应的注意力头,这些注意力头实现了模式匹配机制,并能预测人类因无关提示细节而产生的看似不合理的推理错误。结果表明,人类和LLM的日常因果推理更符合模式匹配而非抽象世界模型。论文推理模型模式匹配LLM认知科学常识推理推荐理由:这项研究挑战了“人类推理基于抽象模型”的传统观点,对AI开发者和认知科学家都有启发——如果你关心LLM为何会犯“愚蠢”错误,或者想理解人类推理的底层机制,这篇论文值得一读。原文
11:10arXiv cs.AI@Noémi Éltető, Nathaniel D. Daw, Kimberly L. Stachenfeld, Kevin J. Miller精选ATLAS 是一个用于自动化科学发现的主动学习框架,旨在通过数据驱动的方式发现可解释的行为模型。它迭代生成机械论假设(以稀疏神经网络集成形式实现),并设计最优实验来区分这些假设。在强化学习代理恢复任务中,ATLAS 相比随机实验实现了 5-10 倍的样本效率提升,其性能甚至优于专家设计的实验。该框架有望加速认知科学等领域中机械论模型的发现过程。论文主动学习机械论建模认知科学强化学习稀疏神经网络推荐理由:ATLAS 解决了科学实验中实验设计效率低下的核心问题,做认知科学或行为建模的研究者可以直接用这个框架加速发现可解释模型,建议点开看看具体实现。原文
09:23arXiv cs.AI@Yuxiang Chen, Jun Wang精选72°一项新研究对DeepSeek-R1-0120模型与人类在AIME 2025数学竞赛30道题上的推理过程进行了全面比较,标注了10247个推理步骤。研究发现,DeepSeek-R1的推理存在“拓扑模仿”现象:它频繁进行浅层验证和局部循环,缺乏人类推理中紧凑的分析与演绎交替结构。然而,成功的推理轨迹显示出稳定的分支和回溯使用,而失败的轨迹则过度或不足使用探索性动作。反思只有在演绎推理中才有效,陷入分析循环的反思往往忽略全局逻辑错误。研究建议改进评估和训练,包括测量跨轨迹稳定性、惩罚“空转”轨迹、鼓励深层逻辑修正。论文推理模型DeepSeek-R1数学推理认知科学评估方法推荐理由:这篇论文戳穿了当前长链推理模型的表面繁荣——做AI推理研究的团队会发现,模型可能只是在模仿推理的“样子”而非真正进步,值得细读其提出的改进方向。原文
10:33arXiv cs.LG@Nathan Roll, Jill Kries, Laura Gwilliams, Cory Shain精选受人类失语症研究启发,研究者提出了一种新方法,通过“损伤”(置零)语言模型中的参数,并观察其输出在临床失语症症状测试(TAB)中的表现,来揭示模型的功能组织。对5个1B参数规模的语言模型进行112,426次测试后,发现模型能表现出全部失语症症状,但分布与人类显著不同。注意力组件(查询、键、值、输出)与前馈组件(上、门、下)之间症状谱差异明显,而同一机制内组件差异较弱。早期层损伤更易导致句法和语义症状,中后期层则更多引发音韵和流畅度缺陷。尽管某些损伤模式与特定人类失语症类型定量相似,但定性差异表明失语症综合征受学习和处理细节影响,而非语言处理中断的领域不变结果。论文语言模型失语症可解释性参数损伤认知科学推荐理由:这项研究为理解语言模型内部功能组织提供了全新视角,做AI可解释性或认知科学交叉研究的团队值得关注——它把临床神经心理学方法搬到了模型分析中,看完会重新思考“模型损伤”的意义。原文
19:11arXiv: DeepSeek@Gabriel Garcia70°该研究揭示了当前思维链(CoT)忠诚度评估中的系统性问题:标准损坏研究(通过替换步骤为错误来测量准确性)实际上检测的是答案文本出现的位置,而非计算发生的位置。实验表明,在GSM8K数据集中,仅移除答案语句(保留所有推理步骤)即可将后缀敏感性降低约19倍(3B模型)。冲突答案实验显示,模型在消费时会系统性地遵循显式答案文本,即使推理过程中未提前确定答案(早期承诺低于5%)。该效应在14B规模下仍明显(8.5倍比率),但在32B时趋于消失。研究提出了三项前提条件作为最低标准:仅问题控制、格式表征、全位置扫描。论文推理模型思维链评估方法认知科学大语言模型推荐理由:该发现对当前CoT忠诚度评估方法的可靠性提出根本性质疑,提醒研究者注意数据格式的混淆效应,对评估模型推理能力具有方法论指导意义。原文