全部 AI 动态 · AI 热点

6月16日

20:46

AITOP6月16日 20:46

600亿美元买下Cursor，xAI终于拿到了编程工具，但真正值得跟踪的或许不是AI

600亿美元买下Cursor，xAI终于拿到了编程工具，但真正值得跟踪的或许不是AI

6月12日

12:57

AITOP6月12日 12:57

Claude代码里藏了个20260612，18个月后的AI记忆革命已经开始倒计时

6月11日

15:28

AITOP6月11日 15:28

1107 vs 303：谷歌悄悄开源了一个“拆打字机”的模型，把大模型速度翻了4倍

15:23

AITOP6月11日 15:23

DiffusionGemma颠覆文本生成？自回归模型的“统治”要结束了

15:07

AITOP6月11日 15:07

每秒1107个token，Google开源的扩散模型为什么能改变本地推理格局？

6月4日

13:46

13:46

AI Will@FinanceYF5

精选

李飞飞和 World Labs 团队指出，当前被统称为「世界模型」的技术实际上包含三种截然不同的方向：视频模型、游戏生成和物理引擎。它们虽然共享同一名称，但在目标、方法和应用上差异巨大。视频模型侧重预测像素序列，游戏生成关注交互式环境构建，物理引擎则强调真实物理规律模拟。这一澄清有助于避免概念混淆，推动各方向更精准的研究与落地。

AI模型世界模型视频模型游戏生成物理引擎李飞飞

推荐理由：做 AI 研究或产品的人经常被「世界模型」这个词搞混——李飞飞帮你拆清楚了，看完能少走弯路，建议点开。

5月23日

10:36

10:36

Ate-a-Pi@svpino

Higgsfield MCP 现已集成到 Manus 平台，使得 Manus 智能体能够调用 Seedance 2.0、Nano Banana Pro、GPT Image 2.0 等前沿图像和视频模型。这意味着用户可以直接利用这些模型为 Meta、Instagram 等平台创建广告内容。这一集成标志着自主内容生成进入新阶段，让 AI 智能体能够独立完成从创意到投放的广告制作流程。

AI产品 MCP/工具智能体广告生成图像模型视频模型

推荐理由：做广告投放或内容创作的团队，现在可以让 Manus 智能体直接调用顶级图像/视频模型生成广告素材，省去手动切换工具的麻烦，建议试试这个自动化工作流。

5月21日

08:00

08:00

歸藏(guizang.ai)@op7418

谷歌最新的视频模型 Gemini Omni 已开始向部分用户推送，标志着该模型从测试阶段进入更广泛可用阶段。Gemini Omni 支持多模态输入，包括视频、图像和文本，能够进行实时视频理解和交互。这一放量意味着更多开发者可以尝试其视频分析能力，如实时场景理解、物体识别和对话式交互。对于 AI 视频应用和实时多模态交互领域，这是一个重要进展。

AI产品谷歌 Gemini Omni 视频模型多模态实时交互

推荐理由：做视频分析和多模态应用的开发者终于可以上手测试了——Gemini Omni 的实时视频理解能力可能改变视频交互方式，建议有相关需求的团队尽早体验。

07:59

07:59

歸藏(guizang.ai)@op7418

83°

谷歌在 I/O 2026 前夕通过 Sundar Pichai 的推文展示了新视频模型的演示，确认该模型支持视频编辑功能。目前尚不清楚视频编辑与生成是统一模型还是分开实现。该演示引发社区关注，预示着谷歌在视频 AI 领域的新进展。更多细节将在 I/O 2026 上公布。

AI产品谷歌视频模型视频编辑 I/O 2026 AI 视频生成

推荐理由：视频编辑是 AI 视频生成的关键痛点，做视频创作或 AI 应用的开发者值得关注谷歌的解法。

07:59

07:59

爱范儿@张子豪

谷歌在最新发布会上推出了 Gemini 3.5 模型、一系列 Agent 产品和视频模型，标志着其 AI 战略的重大升级。Gemini 3.5 在推理和代码生成上显著提升，Agent 产品则让 AI 能自主执行复杂任务。这场发布会展示了谷歌如何用 AI 颠覆自身传统业务，从搜索到云服务全面拥抱智能体。关键细节包括新模型的多模态能力和 Agent 的自主决策功能，对开发者和企业用户影响深远。

AI产品 Gemini 3.5 智能体视频模型谷歌 AI 产品

推荐理由：谷歌用 AI 重新定义自家产品，做搜索、云服务和 AI 应用的团队值得关注——Gemini 3.5 和 Agent 可能改变你依赖的工具生态，建议点开看看具体怎么落地。

5月17日

00:17

00:17

AI Will@FinanceYF5

Google 发布全新视频模型 Gemini Omni，首个生成结果展示了惊人的文字连贯性。该模型在视频中保持了文字的一致性和可读性，被认为是视频领域的“Nano Banana 时刻”。这一突破可能改变视频生成和编辑的方式，尤其对内容创作者和视频制作团队意义重大。目前该模型尚未正式开放，但已引发广泛关注。

AI模型 Gemini 视频模型文字连贯性内容创作 Google

推荐理由：做视频生成或内容创作的团队，Gemini Omni 的文字连贯性可能是你一直在等的突破，值得第一时间关注。