flow·general

Flow

别名
首次出现
2026-05-22
最近出现
2026-06-11
累计提及
59
§ 01综述

近期,Google 围绕 AI 创意平台 Flow 进行了一系列重要更新,并同步推出了视频生成模型 Gemini Omni,标志着 AI 生成内容从图像、文本向视频领域迈出一大步。

主要进展

  • Gemini Omni 模型发布:Google 推出 Gemini Omni,这是一个多模态模型,能够从任意输入(如文本、图像、视频)生成视频内容,并支持自然语言指令进行编辑和修改。该模型宣称能推理物理规律和文化语境,使生成结果更合理。 (Google AI 联合艺术家推出 Pics、Flow Agent 等新工具)
  • Flow 平台升级:Flow 获得重大更新,新增了角色与场景功能,允许用户更精细地控制故事元素。同时,Flow Agent 作为 AI 助手上线,辅助创意过程中的头脑风暴和迭代。Android 应用也同步发布,方便移动端使用。 (谷歌升级 AI 创意平台 Flow:增强视频编辑,Agent 辅助头脑风暴)
  • Drift Flow Matching 新范式:学术论文提出 Drift Flow Matching,旨在桥接单步生成(快速但质量有限)与多步生成(高质量但慢)的差距,为未来高效视频生成提供新思路。 (Drift Flow Matching:连接单步与多步生成的新范式)
  • 当前焦点
    此次更新将 Flow 从静态图像生成工具转变为动态视频创作平台,核心看点在于 Gemini Omni 的一键视频编辑能力以及 Flow Agent 的智能化辅助。用户无需专业技能即可通过自然语言操控内容,大幅降低了创意制作的门槛。

      未来观察点
    • 生成质量与可控性:Gemini Omni 对物理和文化的理解是否足够鲁棒,能否在复杂场景下保持一致性。
    • 伦理与版权:AI 视频生成可能带来虚假信息风险,Google 如何在创意工具与内容安全之间平衡值得关注。
    • 行业竞争:OpenAI 的 Sora 等竞品也在视频生成领域发力,Flow 能否凭借平台生态优势脱颖而出尚待观察。

    总体而言,Flow 与 Gemini Omni 的组合使 AI 创作向全流程视频生成加速,但技术成熟度和社会影响仍需时间检验。

    § 02相关报道10 条在档
    1. 01
      QGF:测试时策略优化,用价值梯度引导流模型生成高回报动作
      arXiv cs.AI
    2. 02
      腾讯混元发布UniRL:统一多模态强化学习框架
      Hunyuan
    3. 03
      LlamaIndex 开源 Parse-Flow:可视化文档处理管道,将 PDF 转为结构化数据
      Jerry Liu
    4. 04
      LlamaIndex 开源 Parse-Flow:可视化文档处理管道
      LlamaIndex
    5. 05
      Google 推出 Gemini Omni:从视频输入生成任意内容
      AI Will
    6. 06
      Google 推出 Gemini Omni:任意输入生成任意内容,从视频开始
      AI Will
    7. 07
      Google AI 联合艺术家推出 Pics、Flow Agent 等新工具
      Google AI
    8. 08
      Google 发布 Gemini Omni:从任意输入生成视频,支持自然语言编辑
      rohanpaul_ai
    9. 09
      Gemini Omni 发布:能推理物理与文化的视频生成模型
      Sundar Pichai
    10. 10
      谷歌升级 AI 创意平台 Flow:增强视频编辑,Agent 辅助头脑风暴
      IT之家
    § 03邻近话题

    本页综述由 AITOP 基于公开报道整理。原报道版权归各自来源所有。

    /topic/Flow