22:23rohanpaul_ai@rohanpaul_ai精选73°Nvidia 推出 Cosmos 3,一个能够理解、模拟和行动于多种物理 AI 任务的统一模型。它将动作视为世界的一等语言,把语言、图像、视频、音频和动作整合到一个共享系统中。该模型通过动作标记设计,让机器人能连接所见与可能发生的事,并决定下一步行动。论文显示,Cosmos 3 可基于视频推断动作,或与未来场景一同生成动作,从而解决机器人抓取、滑动等物理交互问题。论文Cosmos 3Nvidia物理AI多模态动作标记3 个信源在谈推荐理由:Nvidia 让机器人学会动作语言原文
01:02The Rundown AI@therundownai88°Nvidia 在 COMPUTEX 上发布多项重磅产品,覆盖 AI 计算的不同层面。RTX Spark 是与微软合作的新一代 AI 超算芯片,可直接在 Windows 电脑上运行 AI 智能体,无需云端,今年秋季发货。Vera 是 Nvidia 首款专为 AI 智能体设计的 CPU,性能比竞品快 1.8 倍,纽约证券交易所计划用其扩容。Cosmos 3 是开源世界模型,可让机器人和自动驾驶汽车预测场景,现已可用。Nemotron 3 Ultra 是 550B 参数的开源权重模型,本周发布,对标 Kimi K2.6、GLM 5.1 等。AI产品NvidiaRTX SparkVera CPUCosmos 3AI 智能体10 个信源在谈推荐理由:Nvidia 把 AI 智能体从云端拉到本地 PC,做边缘计算或桌面 AI 应用的开发者可以直接关注 RTX Spark;Vera CPU 专为智能体设计,做数据中心或高频交易的团队值得研究。原文
17:51NVIDIA AI@NVIDIAAINVIDIA 展示了其 Cosmos 3 模型的图像转视频生成能力。用户输入一张从仪表盘视角拍摄的 F1 赛车图片,并提示“高速赛车在多个弯道中行驶”,模型生成了连贯且逼真的赛车视频。该演示强调了 Cosmos 3 在视频生成领域的进展,尤其擅长处理动态场景和复杂运动。这一技术有望在影视制作、自动驾驶仿真和游戏开发中发挥重要作用。AI产品NVIDIACosmos 3图像转视频视频生成F110 个信源在谈推荐理由:NVIDIA 的 Cosmos 3 让图像转视频生成达到了新高度,做影视特效或自动驾驶仿真的团队值得关注,直接看效果比读论文更直观。原文
15:07NVIDIA AI@NVIDIAAI精选NVIDIA 宣布其 Cosmos 3 模型完全开源,包括模型权重和训练配方。该模型已在 Hugging Face 上发布,供开发者自由使用。此举延续了 NVIDIA 在 AI 领域开放生态的策略,旨在推动更多创新应用。Cosmos 3 的开放将加速研究者和工程师在视觉、语言等多模态任务上的探索。AI模型开源/仓库多模态模型NVIDIACosmos 3Hugging Face9 个信源在谈推荐理由:NVIDIA 把 Cosmos 3 的权重和训练配方全开源了,做多模态研究的团队可以直接下载使用,省去从头训练的算力成本,值得点开看看。原文