AITOP6月11日 15:28
精选
过去 24 小时,从 849 条中筛出 50 条
6月11日
15:28
1107 vs 303:谷歌悄悄开源了一个“拆打字机”的模型,把大模型速度翻了4倍
15:23
AITOP6月11日 15:23
15:07
AITOP6月11日 15:07
6月10日
11:26
11:26
arXiv cs.AI@Pietro Cagnasso, Eugene Belilovsky, Edouard Oyallon
精选
推荐理由:GASLoC解决了分布式LLM训练中通信效率与异构带宽的痛点,做大规模模型预训练的团队可以直接参考实验对比,看看能否替代现有方案。
6月1日
00:09
AITOP6月1日 00:09
5月29日
5月25日
11:25
11:25
arXiv cs.LG@Taiming Lu, Zhuang Liu
精选72°
推荐理由:做LLM预训练或知识蒸馏的团队,这篇论文直接挑战了“教师越强越好”的默认假设,看完可能会重新设计你的蒸馏策略,值得细读。
