Google 发布 Gemini Omni:从任意输入生成视频,支持自然语言编辑

Google's new Gemini Omni, can generate "anything f…

精选理由

视频创作者和内容团队终于有了一个能像导演一样反复指导修改的 AI 工具,而非一次性的 prompt 生成。做短视频、广告或影视后期的人,可以直接用自然语言调整画面细节,值得关注。

AI 摘要

Google 推出 Gemini Omni,一个能从视频、图像、音频、文本和草图等多种输入生成并编辑视频的 AI 模型。用户只需用自然语言描述,即可添加角色、替换物体、改变动作、调整风格、同步声音或移动镜头,且每次编辑后场景保持稳定。Omni 具备更强的世界理解能力,能更真实地模拟重力、流体运动、动能和物理交互。该模型将集成到 Gemini 应用、Google Flow 和 YouTube Shorts 中。Google 还为 Omni 输出添加了 SynthID 水印和 C2PA 内容凭证,以标识 AI 生成或编辑的媒体。

AI 翻译 · 中文

Google 推出 Gemini Omni,一个能从视频、图像、音频、文本和草图等多种输入生成并编辑视频的 AI 模型。用户只需用自然语言描述,即可添加角色、替换物体、改变动作、调整风格、同步声音或移动镜头,且每次编辑后场景保持稳定。Omni 具备更强的世界理解能力,能更真实地模拟重力、流体运动、动能和物理交互。该模型将集成到 Gemini 应用、Google Flow 和 YouTube Shorts 中。Google 还为 Omni 输出添加了 SynthID 水印和 C2PA 内容凭证,以标识 AI 生成或编辑的媒体。

rohanpaul_aiGoogle's new Gemini Omni, can generate "anything from any input" A video AI model that can create and edit clips from video, images, audio, text, and sketches. A user can record a normal video, then ask Omni to add a cha