英伟达推出全开源全模态物理AI大模型Cosmos 3

让机器人看懂世界:英伟达推出全球首款全开源全模态物理 AI 大模型 Cosmos 3

精选理由

英伟达把物理AI的门槛打下来了——全开源、全模态、训练周期从月缩到天,做机器人、自动驾驶或视觉AI的团队可以直接拿来用,省掉从头造轮子的成本。

AI 摘要

英伟达发布全球首款全开源全模态物理AI大模型Cosmos 3,基于混合Transformer架构,融合视觉推理、世界生成与动作预测能力。该模型可原生理解并生成文本、图像、视频、环境音效及动作内容,物理仿真精度业界领先,能将训练与评估周期从数月缩短至数日。英伟达同时发起Cosmos联盟,联合多家机构推动世界模型技术发展。Cosmos 3提供Super、Nano、Edge三个版本,分别面向机器人/自动驾驶训练、快速推理和边缘端实时推理。

AI 翻译 · 中文

英伟达发布全球首款全开源全模态物理AI大模型Cosmos 3,基于混合Transformer架构,融合视觉推理、世界生成与动作预测能力。该模型可原生理解并生成文本、图像、视频、环境音效及动作内容,物理仿真精度业界领先,能将训练与评估周期从数月缩短至数日。英伟达同时发起Cosmos联盟,联合多家机构推动世界模型技术发展。Cosmos 3提供Super、Nano、Edge三个版本,分别面向机器人/自动驾驶训练、快速推理和边缘端实时推理。

IT之家IT之家 6 月 1 日消息,英伟达今日正式推出英伟达 Cosmos 3,这是一款面向物理人工智能的开放世界基础大模型,依托混合 Transformer 架构打造,在单一系统中融合视觉推理、世界生成与动作预测能力。 英伟达称,Cosmos 3 是全球首款全开源的全模态大模型,可原生理解并生成文本、图像、视频、环境音效及动作内容,物理仿真精度业界领先。它能将物理人工智能的训练与评估周期从数月缩短至数日。 英伟达同时发起英伟达宇宙联盟(NV