AITOP6月11日 15:28
精选
过去 24 小时,从 837 条中筛出 50 条
6月11日
15:28
1107 vs 303:谷歌悄悄开源了一个“拆打字机”的模型,把大模型速度翻了4倍
15:23
AITOP6月11日 15:23
15:07
AITOP6月11日 15:07
11:27
11:27
arXiv cs.AI@Songhao Wu, Ang Lv, Ruobing Xie, Yankai Lin
精选
推荐理由:MoE 模型的路由器设计长期缺乏理论依据,MPI 给出了可解释的优化方向,做大规模 MoE 训练的团队值得关注,能直接提升模型效率。
6月1日
00:09
AITOP6月1日 00:09
