AITOP6月11日 15:28
精选
过去 24 小时,从 728 条中筛出 40 条
6月11日
15:28
1107 vs 303:谷歌悄悄开源了一个“拆打字机”的模型,把大模型速度翻了4倍
15:23
AITOP6月11日 15:23
15:07
AITOP6月11日 15:07
6月1日
00:09
AITOP6月1日 00:09
5月29日
5月19日
14:49
14:49
arXiv cs.LG@Zijian Liu
精选
推荐理由:理论研究者终于有了 AdaGrad 在重尾噪声下的收敛保证,做优化算法分析的人值得关注——它解释了为何 Adam 等自适应方法在真实场景中表现稳健,且无需额外操作。
