Google 发布 Gemini Omni：从任意输入生成视频，支持自然语言编辑

精选理由

视频创作者和内容团队终于有了一个能像导演一样反复指导修改的 AI 工具，而非一次性的 prompt 生成。做短视频、广告或影视后期的人，可以直接用自然语言调整画面细节，值得关注。

AI 摘要

Google 推出 Gemini Omni，一个能从视频、图像、音频、文本和草图等多种输入生成并编辑视频的 AI 模型。用户只需用自然语言描述，即可添加角色、替换物体、改变动作、调整风格、同步声音或移动镜头，且每次编辑后场景保持稳定。Omni 具备更强的世界理解能力，能更真实地模拟重力、流体运动、动能和物理交互。该模型将集成到 Gemini 应用、Google Flow 和 YouTube Shorts 中。Google 还为 Omni 输出添加了 SynthID 水印和 C2PA 内容凭证，以标识 AI 生成或编辑的媒体。

AI 翻译 · 中文

rohanpaul_aiGoogle's new Gemini Omni, can generate "anything from any input" A video AI model that can create and edit clips from video, images, audio, text, and sketches. A user can record a normal video, then ask Omni to add a cha…

IT之家05-19 17:29原文
Greg Brockman05-19 19:32原文

查看原推