精选理由
做机器人或自动驾驶的开发者终于有了一个开源的物理世界理解模型,能直接推理并生成动作,省去多模型拼接的麻烦,值得立即上手试试。
NVIDIA 发布了 Cosmos 3,这是首个开源的物理 AI 全能模型,能够同时进行推理和行动。该模型基于多模态输入(如视觉、语言)理解物理世界,并生成可执行的动作序列。Cosmos 3 在机器人、自动驾驶等需要物理交互的领域具有重大意义,因为它将感知、推理和行动整合在一个模型中。NVIDIA 在 Hugging Face 上开源了该模型,开发者可以直接使用或微调。
AI 翻译 · 中文
NVIDIA 发布了 Cosmos 3,这是首个开源的物理 AI 全能模型,能够同时进行推理和行动。该模型基于多模态输入(如视觉、语言)理解物理世界,并生成可执行的动作序列。Cosmos 3 在机器人、自动驾驶等需要物理交互的领域具有重大意义,因为它将感知、推理和行动整合在一个模型中。NVIDIA 在 Hugging Face 上开源了该模型,开发者可以直接使用或微调。