AITOP6月11日 15:28
精选
过去 24 小时,从 903 条中筛出 49 条
6月11日
15:28
1107 vs 303:谷歌悄悄开源了一个“拆打字机”的模型,把大模型速度翻了4倍
15:23
AITOP6月11日 15:23
15:07
AITOP6月11日 15:07
6月10日
11:38
11:38
arXiv cs.AI@Soham Bhattacharjee, Karun Sharma, Vinay Kumar Sankarapu, Pratinav Seth
精选
推荐理由:做合成数据后训练管线的团队会感兴趣——这篇论文用实验证明了来源证据门控和适应性恢复策略能显著提升数据质量,比简单重采样更高效,建议做数据筛选的开发者点开看看具体方法。
6月1日
00:09
AITOP6月1日 00:09
5月29日
13:03
13:03
arXiv: DeepSeek@Johannes Moll, Jean-Philippe Corbeil, Jiazhen Pan, Martin Hadamitzky, Daniel Rueckert, Lisa Adams, Keno Bressem
精选72°
推荐理由:做LLM智能体自我改进的团队终于有了一个不担心「修好一个、搞坏一个」的方案——GRASP用硬回归预算和门控机制确保每次改进都是净收益,临床场景提升显著,建议做智能体可靠性的开发者点开看看。
5月22日
11:02
11:02
arXiv cs.AI@Ali Hatamizadeh, Yejin Choi, Jan Kautz
精选72°
推荐理由:线性注意力研究者终于有了更精细的门控机制——Gated DeltaNet-2把擦除和写入分开控制,做高效长序列建模的团队可以直接复现并对比效果。
