精选理由
做机器人或自动驾驶的开发者终于有了一个能统一处理多模态输入的物理 AI 模型,值得看看它能带来哪些新可能。
NVIDIA 宣布推出 Cosmos 3,号称首个面向物理 AI 的全模态模型。该模型能够处理多种输入模态(如文本、图像、视频等),并应用于机器人、自动驾驶等物理世界场景。官方展示了多个令人惊叹的示例,体现了模型在理解与生成物理交互方面的能力。这标志着 AI 从数字世界向物理世界迈出了重要一步。
AI 翻译 · 中文
NVIDIA 宣布推出 Cosmos 3,号称首个面向物理 AI 的全模态模型。该模型能够处理多种输入模态(如文本、图像、视频等),并应用于机器人、自动驾驶等物理世界场景。官方展示了多个令人惊叹的示例,体现了模型在理解与生成物理交互方面的能力。这标志着 AI 从数字世界向物理世界迈出了重要一步。
Multiple modalities, many applications. Cosmos 3, the first omni-model for physical AI, is here. Check out some amazing examples below 👇 Your browser does not support the video tag. 🔗 View on Twitter 💬 11 🔄 10 ❤️ 99 …