AITOP6月11日 15:28
精选
过去 24 小时,从 842 条中筛出 46 条
6月11日
15:28
1107 vs 303:谷歌悄悄开源了一个“拆打字机”的模型,把大模型速度翻了4倍
15:23
AITOP6月11日 15:23
15:07
AITOP6月11日 15:07
11:01
11:01
arXiv: DeepSeek@Hao Xiang, Qiaoyu Tang, Le Yu, Yaojie Lu, Xianpei Han, Ben He, Le Sun, Bowen Yu, Peng Wang, Hongyu Lin, Dayiheng Liu
精选
推荐理由:做 LLM 推理强化学习的团队终于有了可扩展的环境构建方案——RACES 用递归组合替代手动堆叠,效率提升 6 倍,值得关注其开源实现。
6月2日
11:17
11:17
arXiv cs.LG@Gjorgjina Cenikj, Jakub Kudela, Eva Tuba, Tome Eftimov
精选
推荐理由:做优化算法选型或自动化机器学习的研究者值得关注——这项研究直接点出了学术基准与真实场景的鸿沟,看完能帮你避开模型部署的坑。
6月1日
00:09
AITOP6月1日 00:09
5月29日
5月25日
11:25
11:25
arXiv cs.LG@Taiming Lu, Zhuang Liu
精选72°
推荐理由:做LLM预训练或知识蒸馏的团队,这篇论文直接挑战了“教师越强越好”的默认假设,看完可能会重新设计你的蒸馏策略,值得细读。
