№flow·general
Flow
别名
- 首次出现
- 2026-05-22
- 最近出现
- 2026-06-11
- 累计提及
- 59
§ 01综述
近期,Google 围绕 AI 创意平台 Flow 进行了一系列重要更新,并同步推出了视频生成模型 Gemini Omni,标志着 AI 生成内容从图像、文本向视频领域迈出一大步。
主要进展
Gemini Omni 模型发布:Google 推出 Gemini Omni,这是一个多模态模型,能够从任意输入(如文本、图像、视频)生成视频内容,并支持自然语言指令进行编辑和修改。该模型宣称能推理物理规律和文化语境,使生成结果更合理。 (Google AI 联合艺术家推出 Pics、Flow Agent 等新工具)
Flow 平台升级:Flow 获得重大更新,新增了角色与场景功能,允许用户更精细地控制故事元素。同时,Flow Agent 作为 AI 助手上线,辅助创意过程中的头脑风暴和迭代。Android 应用也同步发布,方便移动端使用。 (谷歌升级 AI 创意平台 Flow:增强视频编辑,Agent 辅助头脑风暴)
Drift Flow Matching 新范式:学术论文提出 Drift Flow Matching,旨在桥接单步生成(快速但质量有限)与多步生成(高质量但慢)的差距,为未来高效视频生成提供新思路。 (Drift Flow Matching:连接单步与多步生成的新范式)
当前焦点
此次更新将 Flow 从静态图像生成工具转变为动态视频创作平台,核心看点在于 Gemini Omni 的一键视频编辑能力以及 Flow Agent 的智能化辅助。用户无需专业技能即可通过自然语言操控内容,大幅降低了创意制作的门槛。
未来观察点
- 生成质量与可控性:Gemini Omni 对物理和文化的理解是否足够鲁棒,能否在复杂场景下保持一致性。
- 伦理与版权:AI 视频生成可能带来虚假信息风险,Google 如何在创意工具与内容安全之间平衡值得关注。
- 行业竞争:OpenAI 的 Sora 等竞品也在视频生成领域发力,Flow 能否凭借平台生态优势脱颖而出尚待观察。
总体而言,Flow 与 Gemini Omni 的组合使 AI 创作向全流程视频生成加速,但技术成熟度和社会影响仍需时间检验。