全部 AI 动态 · AI 热点

6月16日

20:46

AITOP6月16日 20:46

600亿美元买下Cursor，xAI终于拿到了编程工具，但真正值得跟踪的或许不是AI

600亿美元买下Cursor，xAI终于拿到了编程工具，但真正值得跟踪的或许不是AI

11:06

11:06

arXiv cs.LG@Frank Zhengqing Wu, Francesco Tonin, Volkan Cevher

电路发现是机械可解释性中的关键技术，用于定位执行特定任务的关键模型组件。现有最先进方法EAP-IG在忠信度指标上表现良好，但存在三种方差：重采样方差（用同分布新数据探测时电路变化）、重述方差（提示重新措辞时电路偏移）和样本级方差（低总体不忠信度的电路在单个样本上大幅波动）。本文提出的CEAP方法基于理论保证，能显著减少重采样方差。研究还表明，重述方差源于不同模板激活不同电路，暗示LLM可能本质难以控制。样本级方差主要良性，极差的不忠信度分数常由定义方式或选择性贡献缩放机制导致。

论文 LLM 电路发现机械可解释性 EAP-IG CEAP

推荐理由：这篇论文把电路发现中的方差问题讲透了，还提出了带理论保证的CEAP方法，能减少重采样方差，值得看。

6月12日

12:57

AITOP6月12日 12:57

Claude代码里藏了个20260612，18个月后的AI记忆革命已经开始倒计时

6月11日

15:28

AITOP6月11日 15:28

1107 vs 303：谷歌悄悄开源了一个“拆打字机”的模型，把大模型速度翻了4倍

15:23

AITOP6月11日 15:23

DiffusionGemma颠覆文本生成？自回归模型的“统治”要结束了

15:07

AITOP6月11日 15:07

每秒1107个token，Google开源的扩散模型为什么能改变本地推理格局？

5月11日

11:44

11:44arXiv cs.AI（学术论文）

该论文指出，在机械可解释性研究中，越来越多使用因果词汇（如电路、中介、因果抽象等），但缺乏明确的识别假设。作者对四种方法学流派的10篇论文进行审计，发现没有专门的识别假设部分，验证指标（如忠实度、完整性等）常被当作因果证据，而未说明其识别假设。两名人工编码员对30篇论文的审计重现了主要发现：缺少专门的识别假设部分，验证指标替代普遍存在。论文提议披露规范：声明是否为因果主张、命名识别策略、列举假设、强调至少一个假设，并说明假设失败时结论如何变化，强调验证不等于识别。

论文机械可解释性因果识别方法论审计 AI安全

推荐理由：该研究为可解释性领域提供了方法论反思，提醒研究者注意因果主张的严谨性，避免用验证指标替代因果识别。