全部 AI 动态 · AI 热点

6月16日

20:46

AITOP6月16日 20:46

600亿美元买下Cursor，xAI终于拿到了编程工具，但真正值得跟踪的或许不是AI

600亿美元买下Cursor，xAI终于拿到了编程工具，但真正值得跟踪的或许不是AI

11:06

11:06

arXiv cs.LG@Frank Zhengqing Wu, Francesco Tonin, Volkan Cevher

电路发现是机械可解释性中的关键技术，用于定位执行特定任务的关键模型组件。现有最先进方法EAP-IG在忠信度指标上表现良好，但存在三种方差：重采样方差（用同分布新数据探测时电路变化）、重述方差（提示重新措辞时电路偏移）和样本级方差（低总体不忠信度的电路在单个样本上大幅波动）。本文提出的CEAP方法基于理论保证，能显著减少重采样方差。研究还表明，重述方差源于不同模板激活不同电路，暗示LLM可能本质难以控制。样本级方差主要良性，极差的不忠信度分数常由定义方式或选择性贡献缩放机制导致。

论文 LLM 电路发现机械可解释性 EAP-IG CEAP

推荐理由：这篇论文把电路发现中的方差问题讲透了，还提出了带理论保证的CEAP方法，能减少重采样方差，值得看。

6月12日

12:57

AITOP6月12日 12:57

Claude代码里藏了个20260612，18个月后的AI记忆革命已经开始倒计时

6月11日

15:28

AITOP6月11日 15:28

1107 vs 303：谷歌悄悄开源了一个“拆打字机”的模型，把大模型速度翻了4倍

15:23

AITOP6月11日 15:23

DiffusionGemma颠覆文本生成？自回归模型的“统治”要结束了

15:07

AITOP6月11日 15:07

每秒1107个token，Google开源的扩散模型为什么能改变本地推理格局？