AITP
精选全部 AI 动态AI 日报Agent 接入关于更新日志信源提报反馈
登录 / 注册
AITOP
全部 AI 动态
AI 相关资讯全量信息流
全部博客资讯推文论文
全部模型产品行业论文技巧
标签:参数损伤×
6月16日
20:46
AITOP6月16日 20:46
600亿美元买下Cursor,xAI终于拿到了编程工具,但真正值得跟踪的或许不是AI600亿美元买下Cursor,xAI终于拿到了编程工具,但真正值得跟踪的或许不是AI
6月12日
12:57
AITOP6月12日 12:57
Claude代码里藏了个20260612,18个月后的AI记忆革命已经开始倒计时
6月11日
15:28
AITOP6月11日 15:28
1107 vs 303:谷歌悄悄开源了一个“拆打字机”的模型,把大模型速度翻了4倍
15:23
AITOP6月11日 15:23
DiffusionGemma颠覆文本生成?自回归模型的“统治”要结束了
15:07
AITOP6月11日 15:07
每秒1107个token,Google开源的扩散模型为什么能改变本地推理格局?
5月18日
10:33
10:33arXiv cs.LG@Nathan Roll, Jill Kries, Laura Gwilliams, Cory Shain
精选
受人类失语症研究启发,研究者提出了一种新方法,通过“损伤”(置零)语言模型中的参数,并观察其输出在临床失语症症状测试(TAB)中的表现,来揭示模型的功能组织。对5个1B参数规模的语言模型进行112,426次测试后,发现模型能表现出全部失语症症状,但分布与人类显著不同。注意力组件(查询、键、值、输出)与前馈组件(上、门、下)之间症状谱差异明显,而同一机制内组件差异较弱。早期层损伤更易导致句法和语义症状,中后期层则更多引发音韵和流畅度缺陷。尽管某些损伤模式与特定人类失语症类型定量相似,但定性差异表明失语症综合征受学习和处理细节影响,而非语言处理中断的领域不变结果。
论文语言模型失语症可解释性参数损伤认知科学

推荐理由:这项研究为理解语言模型内部功能组织提供了全新视角,做AI可解释性或认知科学交叉研究的团队值得关注——它把临床神经心理学方法搬到了模型分析中,看完会重新思考“模型损伤”的意义。
原文
精选全部日报登录