AITP
精选全部 AI 动态AI 日报Agent 接入关于更新日志信源提报反馈
登录 / 注册
AITOP
全部 AI 动态
AI 相关资讯全量信息流
全部博客资讯推文论文
全部模型产品行业论文技巧
标签:核机制×
6月16日
20:46
AITOP6月16日 20:46
600亿美元买下Cursor,xAI终于拿到了编程工具,但真正值得跟踪的或许不是AI600亿美元买下Cursor,xAI终于拿到了编程工具,但真正值得跟踪的或许不是AI
6月12日
12:57
AITOP6月12日 12:57
Claude代码里藏了个20260612,18个月后的AI记忆革命已经开始倒计时
6月11日
15:28
AITOP6月11日 15:28
1107 vs 303:谷歌悄悄开源了一个“拆打字机”的模型,把大模型速度翻了4倍
15:23
AITOP6月11日 15:23
DiffusionGemma颠覆文本生成?自回归模型的“统治”要结束了
15:07
AITOP6月11日 15:07
每秒1107个token,Google开源的扩散模型为什么能改变本地推理格局?
5月19日
11:03
11:03arXiv cs.LG@George Whittle, Pranav Vaidhyanathan, Juliusz Ziomek, Natalia Ares, Maike A. Osborne
精选
本文研究了宽神经网络在特征学习机制下的正则化问题,指出梯度流训练隐含的正则化偏好在核机制和特征学习机制中存在根本差异。在核机制中,梯度流自然选择岭回归解,而特征学习机制中岭回归会扭曲网络的归纳偏置,尤其损害预训练模型。作者通过公理化方法定义了规范正则化器,并利用黎曼几何推导出特征学习机制下的测地岭正则化。作为实用替代,提出了弧岭正则化,揭示了早停与规范正则化之间的深层联系。实验在图像处理和NLP迁移学习任务上验证了理论。
论文正则化特征学习黎曼几何核机制深度学习理论

推荐理由:这篇论文解决了特征学习网络缺乏规范正则化理论的痛点,做深度学习理论和正则化研究的学者值得细读——它用黎曼几何统一了核机制和特征学习机制,并给出了可落地的弧岭正则化方案。
原文
精选全部日报登录