AITOP6月11日 15:28
精选
过去 24 小时,从 641 条中筛出 47 条
6月11日
15:28
1107 vs 303:谷歌悄悄开源了一个“拆打字机”的模型,把大模型速度翻了4倍
15:23
AITOP6月11日 15:23
15:07
AITOP6月11日 15:07
6月10日
09:11
09:11
arXiv: DeepSeek@Leonard Engmann, Christian Medeiros Adriano, Holger Giese
精选
推荐理由:MoE 模型剪枝的常用假设被实验证伪了——做模型压缩或可解释性研究的团队,建议重新审视你的专家选择策略,别再依赖路由统计指标。
6月1日
00:09
AITOP6月1日 00:09
5月29日
5月25日
12:05
12:05
AI Will@FinanceYF5
精选
推荐理由:做MoE模型部署或推理优化的团队,ZEDA直接解决了算力浪费问题——跳过一半专家还能保持效果,值得一试。
