AITOP6月11日 15:28
精选
过去 24 小时,从 841 条中筛出 52 条
6月11日
15:28
1107 vs 303:谷歌悄悄开源了一个“拆打字机”的模型,把大模型速度翻了4倍
15:23
AITOP6月11日 15:23
15:07
AITOP6月11日 15:07
6月10日
09:14
09:14
arXiv cs.LG@Waleed Esmail, Stuart Russell, Jana Klinge, Alexander Kappes, Christine Thomas
精选
推荐理由:做物理信号预测或自回归模型长程展开的开发者,这篇论文用严谨的消融实验揭示了多 token 预测的关键作用,值得仔细看实验设计。
6月1日
00:09
AITOP6月1日 00:09
