全部 AI 动态 · AI 热点

5月19日

20:02

20:02

AlphaSignal@AlphaSignalAI

88°

NVIDIA 与牛津大学联合发表论文，提出 EGGROLL 方法，将进化策略（Evolution Strategies）扩展到十亿参数模型，无需反向传播即可训练。该方法用两个低秩矩阵替代密集随机扰动矩阵，大幅降低内存消耗，达到纯推理吞吐量的 91%。EGGROLL 支持数十万并行变异，可与不可微分组件配合，在推理任务上与 GRPO 竞争。团队还训练了纯 8 位整数循环语言模型 EGG，非线性来自整数溢出裁剪，而非激活函数，预训练时种群规模超过百万。

论文进化策略反向传播 NVIDIA 低秩矩阵整数训练

推荐理由：这项研究打破了深度学习十年来的反向传播依赖，做大规模模型训练或非可微分任务（如强化学习、神经架构搜索）的团队可以直接关注 EGGROLL，它可能改变你构建模型的方式。

00:30

00:30

NVIDIA AI@NVIDIAAI

精选

OpenShell v0.0.43 引入双向TTY流，提升终端交互实时性。TUI中新增OIDC认证，增强用户身份验证。HTTPS与mTLS配置解耦，简化安全通信管理。沙箱从ext4磁盘启动，并移除沙箱映射器中的DNS以阻止数据泄露。

AI产品 OpenShell NVIDIA AI安全

推荐理由：NVIDIA的OpenShell更新了，新增双向流和认证支持

5月16日

13:12

13:12

NVIDIA AI@NVIDIAAI

NVIDIA AI 官方账号宣布，基于 DGX Spark 的 Stelline 开发者套件已开始向科学家发货。该套件由 Luigi Cruz 团队开发，旨在将 GPU 加速信号处理引入射电天文学领域，使研究人员能在本地开发计算和网络能力，再部署到天文台。首批设备已交付给科学家，标志着 GPU 加速信号处理在射电天文学中的实际应用迈出重要一步。

AI产品 NVIDIA GPU加速射电天文学 Stelline开发套件信号处理

推荐理由：射电天文学研究者终于有了专用的 GPU 加速开发平台，Stelline 套件让本地开发到天文台部署的流程更顺畅，做信号处理或天文计算的团队值得关注。

12:55

12:55

NVIDIA AI@NVIDIAAI

NVIDIA AI 高管在社交平台分享了一次令人惊叹的本地 AI 体验：他仅通过手机向本地运行的 121B 模型（DGX Spark）提问，Hermes 智能体便自主完成了 8 个测试用例，全部通过。整个过程无需编写一行代码，完全由模型自主完成。这展示了大型模型本地部署的潜力，意味着开发者未来可能只需描述需求，AI 就能自动完成测试、调试等任务。

AI产品 NVIDIA DGX Spark Hermes 智能体本地部署自主测试

推荐理由：本地运行 121B 模型并自主完成测试，这对追求隐私和低延迟的开发者来说是个震撼的 demo——你只需提问，AI 就能搞定一切，建议点开看看未来已来的样子。

5月15日

14:01

14:01

AK@_akhaliq

NVIDIA 在 Hugging Face 上发布了 AnyFlow，这是首个任意步数视频扩散模型。它能够根据文本描述生成高质量视频，且支持在推理时灵活调整步数，无需重新训练。该模型在视频质量和生成效率上取得了平衡，为视频生成领域带来了新的可能性。开发者可以直接在 Hugging Face 上获取模型权重和使用示例。

AI模型 NVIDIA AnyFlow 视频扩散模型 Hugging Face 文本生成视频

推荐理由：做视频生成或扩散模型研究的开发者，现在有了一个无需重新训练就能灵活控制生成步数的工具，值得上手试试。

5月14日

07:26

07:26

NVIDIA AI@NVIDIAAI

NVIDIA 推出了基于技能的 Video Analytics AI Agent，允许开发者通过组合预定义技能（如目标检测、跟踪、行为识别）快速构建视频分析应用。该 Agent 架构支持自然语言指令调用技能，无需手动编程，大幅降低视频 AI 开发门槛。NVIDIA 表示这将加速零售、安防、制造等行业的视频智能部署。

AI产品 NVIDIA 视频分析智能体技能 AI Agent

推荐理由：做视频分析的团队终于可以像搭积木一样构建 AI 应用了——NVIDIA 把复杂技能封装成可调用模块，用自然语言就能编排，建议做安防或零售的开发者点开看看。

07:26

07:26

NVIDIA AI@NVIDIAAI

NVIDIA 强调大规模智能体推理需要平衡模型算法、软件和计算三方面效率。其全栈平台通过计算、网络、存储和内存的极致协同设计，持续优化这些输入。该平台还拥有覆盖数百万开发者的广泛生态系统支持。最终实现更低的每 Token 成本、更高的吞吐量和更可扩展的 AI 系统。

行业 NVIDIA 智能体推理全栈优化成本效率可扩展性

推荐理由：做大规模 AI 推理部署的团队，NVIDIA 的全栈优化思路直接关系到成本与性能，值得关注其协同设计方法。

5月13日

02:41

02:41

NVIDIA AI@NVIDIAAI

NVIDIA AI官方发布了关于Nemotron 3 Nano Omni的专家问答内容，来自Nemotron Labs。该模型是Nemotron系列的最新进展，专注于边缘设备上的高效AI推理。问答中探讨了模型架构、量化技术与实际部署场景，强调了小模型在保持高性能同时降低计算成本的重要性。这标志着NVIDIA在小型化多模态AI模型上的持续投入。

AI模型 NVIDIA Nemotron 边缘推理模型压缩多模态

推荐理由：对于关注边缘AI部署和模型压缩的开发者，Nemotron系列的技术细节具有实际参考价值，尤其适合了解NVIDIA在小模型领域的最新动态。