AITOP6月11日 15:28
精选
过去 24 小时,从 660 条中筛出 46 条
6月11日
15:28
1107 vs 303:谷歌悄悄开源了一个“拆打字机”的模型,把大模型速度翻了4倍
15:23
AITOP6月11日 15:23
15:07
AITOP6月11日 15:07
6月3日
10:45
10:45
arXiv cs.LG@Ali Behrouz, Farnoosh Hashemi, Vahab Mirrokni
精选
推荐理由:做持续学习和模型终身优化的研究者值得关注——它用“睡眠”机制解决了LLM记忆遗忘问题,比传统微调更接近人类学习方式,看完会有启发。
6月1日
00:09
AITOP6月1日 00:09
5月29日
5月21日
10:57
10:57
arXiv cs.AI@Jesse Bettencourt, Xindi Wu, Matan Atzmon, James Lucas, Jonathan Lorraine
精选
推荐理由:做扩散模型下游应用(如文本到 3D、蒸馏)的团队,如果被梯度方差和计算成本困扰,CARV 的 2-3 倍加速值得直接尝试。
5月20日
11:39
11:39
arXiv cs.LG@Thien Le, Melanie Weber
精选
推荐理由:组合优化任务通常依赖大型模型,但部署成本高。本文给出了理论保证,让做图神经网络和算法对齐的开发者知道何时可以安全地蒸馏到小模型,值得关注。
5月19日
11:01
11:01
arXiv cs.LG@Grigory Bartosh, David Ruhe, Emiel Hoogeboom, Jonathan Heek, Thomas Mensink, Tim Salimans
精选
推荐理由:扩散模型推理慢是落地痛点,Dual-Rate Diffusion 用轻量网络复用特征,做图像生成的团队可以直接拿来加速现有模型,效果不打折。
5月15日
00:24
00:24
AK@_akhaliq
精选
推荐理由:视频生成开发者终于有了灵活控制步长的方案——AnyFlow 让生成速度和质量可调,做视频 AI 的团队值得关注,能显著降低推理成本。
