01:11Latent.Space@latentspacepod78°前xAI世界模型负责人兼Nvidia Cosmos研究员Ethan He解释了AI视频可能遵循与编码智能体相同的路径。他认为文本到视频仅处于自动补全阶段,世界模型将变得实时和交互式,语言模型可能成为视频的控制层。未来AI视频可能更像一个拥有摄像头、编辑器、时间线和工具带的智能体,而非简单的提示框。Grok Imagine从零到一的开发过程展示了这一趋势。AI产品视频智能体世界模型Grok Imagine生成式UIxAI10 个信源在谈推荐理由:视频生成领域正在从“生成一段视频”进化到“智能体操控视频”,做AI视频工具或内容创作的团队值得关注这个范式转变。原文