Google推出Gemini Omni，从视频、图像和文本生成高质量视频

精选理由

Google发了能多模态生视频的模型

AI 摘要

Google在Google IO上发布新模型Gemini Omni，可接受图像、视频和文本作为输入，生成高质量视频。该模型利用Gemini的真实世界知识，使视频内容更加准确和连贯。这是多模态视频生成的重要进展，支持从多种混合输入直接创建视频内容。

AI 翻译 · 中文

Google Gemini AppMeet Gemini Omni, our new model that can create anything from any input, starting with video. With Gemini Omni, you can combine images, videos and text as inputs and generate high-quality videos grounded in Gemini's …

查看原推