AITOP6月11日 15:28
精选
过去 24 小时,从 744 条中筛出 45 条
6月11日
15:28
1107 vs 303:谷歌悄悄开源了一个“拆打字机”的模型,把大模型速度翻了4倍
15:23
AITOP6月11日 15:23
15:07
AITOP6月11日 15:07
6月4日
11:29
11:29
arXiv cs.LG@Yaseen M. Osman, Geoff V. Merrett, Stuart E. Middleton
精选
推荐理由:如果你在做ICL样本选择或主动学习,这篇论文用实验告诉你MLP激活值这条路走不通,省下试错时间。做LLM推理效率或特征分析的开发者,看完会理解为什么SAE可能是更好的方向。
6月1日
00:09
AITOP6月1日 00:09
