AITP
精选全部 AI 动态AI 日报Agent 接入关于更新日志信源提报反馈
登录 / 注册
AITOP
全部 AI 动态
AI 相关资讯全量信息流
全部博客资讯推文论文
全部模型产品行业论文技巧
标签:视频模型×
6月16日
20:46
AITOP6月16日 20:46
600亿美元买下Cursor,xAI终于拿到了编程工具,但真正值得跟踪的或许不是AI600亿美元买下Cursor,xAI终于拿到了编程工具,但真正值得跟踪的或许不是AI
6月12日
12:57
AITOP6月12日 12:57
Claude代码里藏了个20260612,18个月后的AI记忆革命已经开始倒计时
6月11日
15:28
AITOP6月11日 15:28
1107 vs 303:谷歌悄悄开源了一个“拆打字机”的模型,把大模型速度翻了4倍
15:23
AITOP6月11日 15:23
DiffusionGemma颠覆文本生成?自回归模型的“统治”要结束了
15:07
AITOP6月11日 15:07
每秒1107个token,Google开源的扩散模型为什么能改变本地推理格局?
6月4日
13:46
13:46AI Will@FinanceYF5
精选
李飞飞和 World Labs 团队指出,当前被统称为「世界模型」的技术实际上包含三种截然不同的方向:视频模型、游戏生成和物理引擎。它们虽然共享同一名称,但在目标、方法和应用上差异巨大。视频模型侧重预测像素序列,游戏生成关注交互式环境构建,物理引擎则强调真实物理规律模拟。这一澄清有助于避免概念混淆,推动各方向更精准的研究与落地。
AI模型世界模型视频模型游戏生成物理引擎李飞飞

推荐理由:做 AI 研究或产品的人经常被「世界模型」这个词搞混——李飞飞帮你拆清楚了,看完能少走弯路,建议点开。
原文
5月23日
10:36
10:36Ate-a-Pi@svpino
Higgsfield MCP 现已集成到 Manus 平台,使得 Manus 智能体能够调用 Seedance 2.0、Nano Banana Pro、GPT Image 2.0 等前沿图像和视频模型。这意味着用户可以直接利用这些模型为 Meta、Instagram 等平台创建广告内容。这一集成标志着自主内容生成进入新阶段,让 AI 智能体能够独立完成从创意到投放的广告制作流程。
AI产品MCP/工具智能体广告生成图像模型视频模型

推荐理由:做广告投放或内容创作的团队,现在可以让 Manus 智能体直接调用顶级图像/视频模型生成广告素材,省去手动切换工具的麻烦,建议试试这个自动化工作流。
原文
5月21日
08:00
08:00歸藏(guizang.ai)@op7418
谷歌最新的视频模型 Gemini Omni 已开始向部分用户推送,标志着该模型从测试阶段进入更广泛可用阶段。Gemini Omni 支持多模态输入,包括视频、图像和文本,能够进行实时视频理解和交互。这一放量意味着更多开发者可以尝试其视频分析能力,如实时场景理解、物体识别和对话式交互。对于 AI 视频应用和实时多模态交互领域,这是一个重要进展。
AI产品谷歌Gemini Omni视频模型多模态实时交互

推荐理由:做视频分析和多模态应用的开发者终于可以上手测试了——Gemini Omni 的实时视频理解能力可能改变视频交互方式,建议有相关需求的团队尽早体验。
原文
07:59
07:59歸藏(guizang.ai)@op7418
83°
谷歌在 I/O 2026 前夕通过 Sundar Pichai 的推文展示了新视频模型的演示,确认该模型支持视频编辑功能。目前尚不清楚视频编辑与生成是统一模型还是分开实现。该演示引发社区关注,预示着谷歌在视频 AI 领域的新进展。更多细节将在 I/O 2026 上公布。
AI产品谷歌视频模型视频编辑I/O 2026AI 视频生成

推荐理由:视频编辑是 AI 视频生成的关键痛点,做视频创作或 AI 应用的开发者值得关注谷歌的解法。
原文
5月17日
00:17
00:17AI Will@FinanceYF5
Google 发布全新视频模型 Gemini Omni,首个生成结果展示了惊人的文字连贯性。该模型在视频中保持了文字的一致性和可读性,被认为是视频领域的“Nano Banana 时刻”。这一突破可能改变视频生成和编辑的方式,尤其对内容创作者和视频制作团队意义重大。目前该模型尚未正式开放,但已引发广泛关注。
AI模型Gemini视频模型文字连贯性内容创作Google

推荐理由:做视频生成或内容创作的团队,Gemini Omni 的文字连贯性可能是你一直在等的突破,值得第一时间关注。
原文
精选全部日报登录