AITOP6月11日 15:28
精选
过去 24 小时,从 657 条中筛出 46 条
6月11日
15:28
1107 vs 303:谷歌悄悄开源了一个“拆打字机”的模型,把大模型速度翻了4倍
15:23
AITOP6月11日 15:23
15:07
AITOP6月11日 15:07
6月3日
10:45
10:45
arXiv cs.LG@Ali Behrouz, Farnoosh Hashemi, Vahab Mirrokni
精选
推荐理由:做持续学习和模型终身优化的研究者值得关注——它用“睡眠”机制解决了LLM记忆遗忘问题,比传统微调更接近人类学习方式,看完会有启发。
6月1日
00:09
AITOP6月1日 00:09
5月29日
5月26日
11:44
11:44
arXiv cs.AI@Sangyun Lee, Sean McLeish, Tom Goldstein, Giulia Fanti
精选
推荐理由:这项研究给长上下文推理带来了新思路——用类似睡眠的离线巩固机制解决注意力瓶颈,做长链推理或复杂数学问题的开发者值得关注,尤其适合处理超长上下文的场景。
