AITP
精选全部 AI 动态AI 日报Agent 接入关于更新日志信源提报反馈
登录 / 注册
AITOP
全部 AI 动态
AI 相关资讯全量信息流
全部博客资讯推文论文
全部模型产品行业论文技巧
标签:低秩矩阵×
6月16日
20:46
AITOP6月16日 20:46
600亿美元买下Cursor,xAI终于拿到了编程工具,但真正值得跟踪的或许不是AI600亿美元买下Cursor,xAI终于拿到了编程工具,但真正值得跟踪的或许不是AI
6月12日
12:57
AITOP6月12日 12:57
Claude代码里藏了个20260612,18个月后的AI记忆革命已经开始倒计时
6月11日
15:28
AITOP6月11日 15:28
1107 vs 303:谷歌悄悄开源了一个“拆打字机”的模型,把大模型速度翻了4倍
15:23
AITOP6月11日 15:23
DiffusionGemma颠覆文本生成?自回归模型的“统治”要结束了
15:07
AITOP6月11日 15:07
每秒1107个token,Google开源的扩散模型为什么能改变本地推理格局?
5月19日
20:02
20:02AlphaSignal@AlphaSignalAI
88°
NVIDIA 与牛津大学联合发表论文,提出 EGGROLL 方法,将进化策略(Evolution Strategies)扩展到十亿参数模型,无需反向传播即可训练。该方法用两个低秩矩阵替代密集随机扰动矩阵,大幅降低内存消耗,达到纯推理吞吐量的 91%。EGGROLL 支持数十万并行变异,可与不可微分组件配合,在推理任务上与 GRPO 竞争。团队还训练了纯 8 位整数循环语言模型 EGG,非线性来自整数溢出裁剪,而非激活函数,预训练时种群规模超过百万。
论文进化策略反向传播NVIDIA低秩矩阵整数训练

推荐理由:这项研究打破了深度学习十年来的反向传播依赖,做大规模模型训练或非可微分任务(如强化学习、神经架构搜索)的团队可以直接关注 EGGROLL,它可能改变你构建模型的方式。
原文
精选全部日报登录