20:02AlphaSignal@AlphaSignalAI88°NVIDIA 与牛津大学联合发表论文,提出 EGGROLL 方法,将进化策略(Evolution Strategies)扩展到十亿参数模型,无需反向传播即可训练。该方法用两个低秩矩阵替代密集随机扰动矩阵,大幅降低内存消耗,达到纯推理吞吐量的 91%。EGGROLL 支持数十万并行变异,可与不可微分组件配合,在推理任务上与 GRPO 竞争。团队还训练了纯 8 位整数循环语言模型 EGG,非线性来自整数溢出裁剪,而非激活函数,预训练时种群规模超过百万。论文进化策略反向传播NVIDIA低秩矩阵整数训练推荐理由:这项研究打破了深度学习十年来的反向传播依赖,做大规模模型训练或非可微分任务(如强化学习、神经架构搜索)的团队可以直接关注 EGGROLL,它可能改变你构建模型的方式。原文
00:30NVIDIA AI@NVIDIAAI精选OpenShell v0.0.43 引入双向TTY流,提升终端交互实时性。TUI中新增OIDC认证,增强用户身份验证。HTTPS与mTLS配置解耦,简化安全通信管理。沙箱从ext4磁盘启动,并移除沙箱映射器中的DNS以阻止数据泄露。AI产品OpenShellNVIDIAAI安全3 个信源在谈推荐理由:NVIDIA的OpenShell更新了,新增双向流和认证支持原文
13:12NVIDIA AI@NVIDIAAINVIDIA AI 官方账号宣布,基于 DGX Spark 的 Stelline 开发者套件已开始向科学家发货。该套件由 Luigi Cruz 团队开发,旨在将 GPU 加速信号处理引入射电天文学领域,使研究人员能在本地开发计算和网络能力,再部署到天文台。首批设备已交付给科学家,标志着 GPU 加速信号处理在射电天文学中的实际应用迈出重要一步。AI产品NVIDIAGPU加速射电天文学Stelline开发套件信号处理推荐理由:射电天文学研究者终于有了专用的 GPU 加速开发平台,Stelline 套件让本地开发到天文台部署的流程更顺畅,做信号处理或天文计算的团队值得关注。原文
12:55NVIDIA AI@NVIDIAAINVIDIA AI 高管在社交平台分享了一次令人惊叹的本地 AI 体验:他仅通过手机向本地运行的 121B 模型(DGX Spark)提问,Hermes 智能体便自主完成了 8 个测试用例,全部通过。整个过程无需编写一行代码,完全由模型自主完成。这展示了大型模型本地部署的潜力,意味着开发者未来可能只需描述需求,AI 就能自动完成测试、调试等任务。AI产品NVIDIADGX SparkHermes 智能体本地部署自主测试推荐理由:本地运行 121B 模型并自主完成测试,这对追求隐私和低延迟的开发者来说是个震撼的 demo——你只需提问,AI 就能搞定一切,建议点开看看未来已来的样子。原文
14:01AK@_akhaliqNVIDIA 在 Hugging Face 上发布了 AnyFlow,这是首个任意步数视频扩散模型。它能够根据文本描述生成高质量视频,且支持在推理时灵活调整步数,无需重新训练。该模型在视频质量和生成效率上取得了平衡,为视频生成领域带来了新的可能性。开发者可以直接在 Hugging Face 上获取模型权重和使用示例。AI模型NVIDIAAnyFlow视频扩散模型Hugging Face文本生成视频推荐理由:做视频生成或扩散模型研究的开发者,现在有了一个无需重新训练就能灵活控制生成步数的工具,值得上手试试。原文
07:26NVIDIA AI@NVIDIAAINVIDIA 推出了基于技能的 Video Analytics AI Agent,允许开发者通过组合预定义技能(如目标检测、跟踪、行为识别)快速构建视频分析应用。该 Agent 架构支持自然语言指令调用技能,无需手动编程,大幅降低视频 AI 开发门槛。NVIDIA 表示这将加速零售、安防、制造等行业的视频智能部署。AI产品NVIDIA视频分析智能体技能AI Agent推荐理由:做视频分析的团队终于可以像搭积木一样构建 AI 应用了——NVIDIA 把复杂技能封装成可调用模块,用自然语言就能编排,建议做安防或零售的开发者点开看看。原文
07:26NVIDIA AI@NVIDIAAINVIDIA 强调大规模智能体推理需要平衡模型算法、软件和计算三方面效率。其全栈平台通过计算、网络、存储和内存的极致协同设计,持续优化这些输入。该平台还拥有覆盖数百万开发者的广泛生态系统支持。最终实现更低的每 Token 成本、更高的吞吐量和更可扩展的 AI 系统。行业NVIDIA智能体推理全栈优化成本效率可扩展性推荐理由:做大规模 AI 推理部署的团队,NVIDIA 的全栈优化思路直接关系到成本与性能,值得关注其协同设计方法。原文
02:41NVIDIA AI@NVIDIAAINVIDIA AI官方发布了关于Nemotron 3 Nano Omni的专家问答内容,来自Nemotron Labs。该模型是Nemotron系列的最新进展,专注于边缘设备上的高效AI推理。问答中探讨了模型架构、量化技术与实际部署场景,强调了小模型在保持高性能同时降低计算成本的重要性。这标志着NVIDIA在小型化多模态AI模型上的持续投入。AI模型NVIDIANemotron边缘推理模型压缩多模态推荐理由:对于关注边缘AI部署和模型压缩的开发者,Nemotron系列的技术细节具有实际参考价值,尤其适合了解NVIDIA在小模型领域的最新动态。原文