全部 AI 动态 · AI 热点

6月19日

04:32

The Rundown AI@therundownai

OpenAI于3月取消了与迪士尼的10亿美元合作计划。迪士尼幻想工程随后与Adobe合作，利用自家IP（米奇、冰雪奇缘、汽车总动员）训练AI，旨在加速主题公园设计。迪士尼还宣布将在7月推出新的beta工具，该工具能为小广告主生成完整电视广告（包括脚本、视频和音乐）。该工具主要面向预算有限、无法负担创意代理的小型企业。

行业 Disney OpenAI Adobe 广告生成视频生成

推荐理由：迪士尼不跟OpenAI玩了，自己联手Adobe用经典IP训练AI，还要出广告生成工具，挺实在的。

原文

03:02

HeyGen@HeyGen_Official

HeyGen推出MCP服务器，可集成到Cursor AI中。只需在Cursor中指向项目的README文件，输入一条提示，AI就能自动提取产品功能和定价信息，生成完整的发布视频。整个过程无需拍摄或剪辑，直接从仓库数据生成。该功能降低了产品视频制作的门槛，适合快速发布演示。

技巧 HeyGen Cursor MCP 视频生成智能体

推荐理由：HeyGen出了MCP服务器，扔进Cursor里，读你的README就能自动生成产品视频，省去拍摄剪辑，超实用！

原文

6月18日

11:23

Justine Moore@venturetwins

73°

xAI推出Grok Imagine Video 1.5，这是其图像转视频模型的新版本。该模型在物理模拟、画面真实感和生成速度上均有改进，支持单次生成高质量视频。用户测试中，先用Grok生成图像，再通过该模型一次性转换为视频。xAI称其具备“更清晰的真实感、更好的物理和更快的生成速度”。

AI模型 Grok Imagine Video 1.5 xAI 视频生成图像转视频

推荐理由：xAI出了新视频模型，图像转视频一次搞定，物理和真实感都更好，速度还快，值得试试。

原文

6月17日

23:33

xAI@xai

xAI 展示了用户 heavygulp 使用其新模型制作的电影预告片。该视频在 Twitter 上获得 226 万次观看和 2022 个点赞。模型能够生成堪比特效大片的流畅镜头和光影效果。这体现了 xAI 在视频生成领域的最新成果，模型具备极高的可用性和画质。

AI模型 xAI heavygulp 视频生成

推荐理由：xAI 新模型太强了，用户 heavygulp 用 AI 做出了电影预告片，效果惊艳，值得一看。

原文

23:15

xAI@xai

74°

xAI 发布 Imagine Video 1.5 视频生成模型，即日起在 API 中开放使用。消费者端同步推出 Video 1.5 Fast，质量更优且等待时间大幅减少。720p 视频渲染时间从之前模型的 40 多秒降至约 25 秒。

AI模型 Imagine Video 1.5 xAI Video 1.5 Fast 视频生成

推荐理由：xAI 的 Imagine Video 1.5 来了，视频生成更快，720p 只要 25 秒，API 也能调用了。

原文

12:43

12:43IT之家（博客/媒体）

xAI 于 6 月 17 日正式上线 Grok Imagine Video 1.5 模型，此前该模型于 6 月 3 日推出预览版。相比前代，模型升级了音画同步，可同时生成音效、环境音和对话，口型同步更自然。运动连贯性提升，减少了肢体扭曲和漂浮假象，能更好模拟重量与动量。在 Fast 模式下，生成 6 秒 720p 视频仅需约 25 秒，而前代需要 40 秒以上，现已通过 xAI API 提供。

AI模型 Grok Imagine Video 1.5 xAI 视频生成

推荐理由：xAI 刚上线的 Grok Imagine Video 1.5，6 秒 720P 视频生成只要 25 秒，音画同步和运动真实感比前代强不少，做短视频挺合适。

原文

11:00

Yangyi@Yangyixxxx

推文分享一个基于牛马AI平台构建视频的5步工作流：1）选感兴趣赛道；2）用费曼学习法向AI提问；3）在牛马AI中安装视频生成skills（如baoyu-design skill，近期上线动画功能）；4）让AI将对话整理成HTML动画；5）输出视频发布。还提到HeyGen此前发布的hyperframes也可尝试。方法零门槛，利用现有skills快速生成内容。

技巧牛马AI baoyu-design HeyGen hyperframes 视频生成提示词工程

推荐理由：教你5步用牛马AI的skills和费曼学习法做视频，还能试试baoyu-design和HeyGen的hyperframes，上手快

原文

11:00

Yangyi@Yangyixxxx

精选

宝玉发布 baoyu-design skill，可在本地生成动画视频并导出 mp4 格式。该工具基于声明式动画引擎，每一帧由时间函数 f(t) 决定，支持随意跳转和精确调试。导出时用无头 Chromium 逐帧截图（30fps），经 ffmpeg 编码为 3840×2160（2x DPR）后缩放至 1080p，确保画质。相比 Claude Design 网页版只能在线查看，此工具可离线导出清晰视频。

技巧 baoyu-design 动画视频视频生成开源工具 Claude Design

推荐理由：宝玉搞了个本地动画工具 baoyu-design，能直接导出 mp4，比 Claude Design 网页版实用多了，而且开源免费。

原文

08:31

08:31IT之家（博客/媒体）

据晚点LatePost，豆包日活超2亿，每天收入不足百万元（主要来自电商佣金），而日消耗算力成本达数千万元（不含训练算力中心成本）。字节高层访问Anthropic后调整AI资源分配，重心从豆包转向企业服务。字节Seedance年化收入（ARR）已达20亿美元（约135.4亿元人民币），单月超10亿元，基本抵消豆包算力成本，且绝大多数收入来自企业客户。同时，字节发布Seedance 2.0 Mini视频生成模型，定位高性价比，瞄准视频创作与规模化生产。

行业字节跳动豆包 Seedance 企业服务视频生成

推荐理由：字节把AI重心从豆包挪到企业服务了，Seedance一年营收20亿美元，已经能覆盖豆包的算力成本。想看具体数据和分析？点进来。

原文

04:49

阿里通义 Qwen@Alibaba_Qwen

精选72°

Qwen-RobotWorld由阿里巴巴Qwen团队发布，将自然语言视为通用动作接口，统一末端执行器姿态、转向命令和导航点。该模型在具身世界知识语料库（860万视频-文本对、超2亿帧）上联合训练20+种具身类型和500+个动作类别。在EWMBench、DreamGen、WorldModelBench、PBench等基准测试中表现强劲。这一方法桥接了通用视频生成模型与领域专用具身模型之间的鸿沟。

AI模型 Qwen-RobotWorld 阿里巴巴具身智能视频生成基准测试

推荐理由：Qwen把自然语言当遥控器，一个模型搞定机器臂、自动驾驶、无人机等20多种动作，还赢了多个基准，挺有意思。

原文

6月16日

17:30

腾讯混元 Tencent Hunyuan@TencentCloud

精选

腾讯云推出AI驱动的全球体育流媒体解决方案，支持4K优化和亚秒级延迟直播。该方案提供20+语言的AI实时解说和自动集锦生成，降低制作成本。全球部署3200+节点，200 Tbps带宽覆盖70+地区，实现全天候无人值守检测和SSAI精准广告货币化。

AI产品 Tencent Cloud AI体育直播 4K流媒体视频生成低延迟

推荐理由：腾讯云这个体育流媒体方案挺强的，4K画质亚秒延迟，还能自动用20种语言解说比赛，全球覆盖也广，搞直播的可以看看。

原文

16:34

AI Will@FinanceYF5

83°

NVIDIA 发布了 SANA-Streaming 模型，支持对长达一分钟的视频进行实时编辑。用户可以在视频播放过程中更改服装、背景、风格和场景。该模型无需等待渲染，即可直接看到修改结果。

AI模型 NVIDIA SANA-Streaming 视频生成实时编辑

推荐理由：NVIDIA 出了 SANA-Streaming，放视频时就能实时换衣服换背景，一分钟的长视频也能改

原文

09:52

09:52IT之家（博客/媒体）

火山引擎于 6 月 15 日上线 Seedance 2.0 Mini 模型，官方称其生成速度快于 Seedance 2.0 Fast 约 2 倍，输出质量相当。定价方面，图生视频 0.023 元/千 tokens，视频生视频 0.014 元/千 tokens，720P 规格下单秒成本约 0.5 元，较标准版降低约一半。该模型主要面向电商内容、营销素材、UGC 创作等高频率生产场景。

AI模型 Seedance 2.0 Mini 字节跳动火山引擎视频生成性价比

推荐理由：字节跳动刚出的视频模型，成本只有上一代一半，速度还快两倍，电商和做UGC的可以试试批量出素材。

原文

09:35

HeyGen@HeyGen_Official

HeyGen发布了HyperFrames，一种基于HTML原生的视频创作方式，每个场景由真实代码构成而非时间线导出。推文展示了其构建流程：包含开场头像、"Introducing HeyGen + Stripe"锁定画面、三步命令终端动画（添加Stripe项目智能体→安装→生成视频）、以及旋转词循环（发现/配置/生成/支付）等模块。该工具允许开发者通过代码控制每个场景的动画和交互，支持智能体自主生成视频。

AI产品 HeyGen HyperFrames 视频生成代码智能体

推荐理由：HeyGen搞了个新玩意HyperFrames，不再靠拖时间线做视频，而是直接写代码来组合每个场景，还集成了Stripe智能体。想试试用代码做视频的可以看看。

原文

09:24

Pika Labs@pika_labs

Pika Labs 在 X 平台宣布推出语音控制（非常测试版）功能，用户可直接通过语音或文字指令让智能体完成从概念、选角、故事板到视频片段生成的全流程。生成的镜头直接放入时间线和素材库，支持通过时间线或与智能体对话进行编辑。该智能体能理解项目上下文，避免重复解释。目前支持浏览器内使用，需查看 Twitter 详情。

AI产品 Pika 视频生成智能体语音控制

推荐理由：Pika 这个新功能让你用嘴就能指挥 AI 做视频，从剧本到成片一步到位，省去重复说明的麻烦。

原文

09:22

Runway ML@runwayml

Runway 宣布其视频和图像生成与编辑功能直接集成到 ChatGPT 中，用户无需在标签页之间切换即可使用。该集成支持在 ChatGPT 对话界面内直接调用 Runway 的模型生成视频和图像。Runway 此前已提供文本生成视频、图像编辑等功能，此次与 ChatGPT 的整合简化了工作流程。用户可同时利用 ChatGPT 的对话能力和 Runway 的多模态生成能力。

AI产品 Runway ChatGPT 视频生成图像生成多模态

推荐理由：Runway 直接嵌进 ChatGPT 里了，不用来回切页面就能生成和编辑视频图片，特别方便。

原文

03:01

腾讯混元 Tencent Hunyuan@TencentCloud

腾讯云近日在日本举办了一场仅限受邀高管参加的闭门会议，讨论AIGC在图像、视频和文本生成领域的商业潜力。会议重点探讨了AI驱动的图像视频生产、AI漫画与短剧IP变现、广告创意转型以及AIGC平台兴起等议题。腾讯云展示了其MPS媒体处理解决方案和全球基础设施，如何帮助企业在媒体处理、AI生成和内容分发上从实验走向实际效率与创意扩展。参会者包括AI生成平台运营商、IP内容创作者、广告创意人员和日本市场AIGC专家，共同确认了生态快速演进的趋势。

行业 Tencent Cloud AIGC 日本 MPS 视频生成

推荐理由：腾讯云在日本拉了群行业大佬，聊AIGC怎么从概念变成真金白银的生意，不是画饼，有具体场景和方案。

原文

6月15日

18:18

AI Will@FinanceYF5

Fable 5 的自动化故事板创建器只需输入创意，通过 LLM 生成分镜脚本，再用文本到图像模型生成关键画面，最后用图像到视频模型转化为动态镜头。该工具还能生成 B-roll 镜头和 360 度全景画面，用于 Seedance 2 的 ground truth 数据。所有输出节点均可手动编辑修改，实现从文案到电影的端到端自动化。

技巧 Fable 5 Seedance 2 故事板自动化视频生成

推荐理由：这个工具让你写个想法就能自动出故事板，连B-roll和全景视频都能生成，做视频前期超省事。

原文

17:51

阿里云 Alibaba Cloud@alibaba_cloud

阿里云使用其Qwen和Wan模型创作了一支展示阿联酋文化的AI视频。视频融合了沙漠、阿拉伯书法、传统待客之道和迪拜现代天际线。Qwen是阿里云的大语言模型，Wan是视频生成模型。该视频通过Model Studio平台生成，体现AI连接传统与创新的能力。

AI产品 Qwen Wan Alibaba Cloud Model Studio 视频生成

推荐理由：阿里云用自家Qwen和Wan生成了一支阿联酋风情视频，把沙漠、书法和摩天楼全串起来了，展示AI视频创作能力。

原文

17:50

阿里云 Alibaba Cloud@alibaba_cloud

阿里云使用其Qwen和Wan模型创作了一段AI视频，重新演绎墨西哥文化。视频融合了mariachi音乐和Zapotec编织图案等元素。从古老圣地到现代创新中心，展示了AI连接过去与未来的能力。该创作可通过阿里云Model Studio平台体验。

AI模型 Qwen Wan Alibaba Cloud 视频生成多模态

推荐理由：阿里云用Qwen和Wan模型做了一个墨西哥文化AI视频，画面很有创意，展示了模型在艺术创作上的能力。

原文

6月14日

21:58

Decoder@Jonathan Kemper

精选

Mirage由微软研究院与多所大学联合开发。它直接在潜在空间存储场景信息，而非基于像素的点云。该方法将计算时间和显存需求大幅降低，同时支持长镜头下的空间一致性。模型目前无法可靠追踪跨片段的移动物体。

AI模型 Mirage Microsoft Research 视频生成世界模型潜在空间

推荐理由：视频生成空间记忆新方案

原文

6月13日

13:26

berryxia@berryxia

Aether AI创始人黄碧薇教授指出，当前视频生成模型仅学习“手靠近杯子时杯子会动”的相关性，而非因果机制。其团队benchmark显示，因果结构可使机器人任务成功率提升25-50%，样本需求降低5-10倍。在物理世界如机器人、自动驾驶中，相关性模型易产生危险幻觉，因果世界模型旨在让AI理解机制而非表象。

行业 Aether AI 因果模型机器人视频生成

推荐理由：黄碧薇讲透了AI在物理世界的短板

原文

6月12日

20:46

20:46IT之家（博客/媒体）

字节跳动旗下火山引擎与香港电视广播有限公司（TVB）达成深度合作，将围绕豆包视频生成模型Seedance 2.0的应用落地，在影视内容智能化生产、短剧制作、IP商业化探索及云基础设施建设等方面展开合作。双方将协同TVB旗下FF工作室，以AI短剧为契机，利用Seedance 2.0的视频生成能力，探索AI在短剧创作和制作流程中的应用。此外，火山引擎还将为TVB提供虚拟机、对象存储、网络资源、云数据库、视频云、CDN内容分发等云产品与服务。这标志着视频生成模型在传统影视行业的首次大规模落地尝试。

AI产品视频生成 Seedance 2.0 TVB 火山引擎短剧制作

推荐理由：传统电视台终于开始拥抱AI视频生成——TVB与火山引擎的合作让Seedance 2.0有了真实影视场景的落地机会，做短剧、影视内容的团队值得关注，看看AI能否真正改变制作流程。

原文

09:25

arXiv cs.AI@Jiwen Liu, Shujuan Li, Zhixue Fang, Xiaohan Li, Yan Zhou, Zijie Meng, Zhimin Zhang, Yawen Luo, Guoxin Zhang, Yu-Shen Liu, Pengfei Wan

OmniDirector 提出了一种通用相机运动表示方法，将相机参数编码为网格运动视频，从而支持多镜头视频生成。该框架在百万级相机网格-视频对上训练，能够协调角色、动作和相机，提供导演级别的控制。它设计了一种分层提示扩展代理，通过理解信号关系系统描述相机运动和视觉内容，实现不同控制信号的和谐集成。实验表明，OmniDirector 在复杂相机运动克隆任务上表现优异，解决了现有方法依赖配对数据且性能不佳的问题。

论文相机运动克隆视频生成多镜头扩散Transformer OmniDirector

推荐理由：做视频生成和相机运动控制的团队终于有了一个无需配对数据就能克隆多镜头相机运动的方案——OmniDirector 用网格运动视频统一了相机表示，直接在百万级数据上训练，效果比依赖合成配对数据的方法好很多，做视频编辑和影视制作的开发者值得关注。

原文

01:05

Logan Kilpatrick@OfficialLoganK

Google的Gemini Omni Flash模型在图像生成视频、文本生成视频以及视频编辑三个任务上均达到最佳性能（SOTA）。该模型即将通过API向开发者开放。具体基准数据尚未公布。

AI模型 Gemini Omni Flash Google 视频生成多模态

推荐理由：Google新视频模型SOTA

原文

00:41

lmarena.ai@lmarena_ai

精选

Gemini Omni Flash在Image-to-Video基准测试中与第一名并列。该成绩相比Veo 3.1实现了77个百分点的提升。该模型为Gemini系列最新成员，专注于多模态任务。

AI模型 Gemini Omni Flash Veo 3.1 图像到视频视频生成

推荐理由：新模型视频生成超Veo 3.1

原文

6月11日

00:19

HeyGen@HeyGen_Official

HeyGen 宣布其 AI 视频生成服务可通过 Stripe Projects 被 AI 代理自动发现、配置、存储凭证并支付，整个过程无需用户注册、粘贴 API 密钥或人工干预。这意味着开发者构建的 AI 代理现在能自主调用 HeyGen 生成视频，实现完全自动化的视频内容生产流水线。该集成降低了 AI 代理使用视频生成能力的门槛，为自动化营销、内容创作等场景提供了新可能。

AI产品 AI 代理 Stripe Projects HeyGen 自动化视频生成

推荐理由：做 AI 代理或自动化工作流的开发者终于可以省去手动配置 API 的麻烦——HeyGen 与 Stripe Projects 的集成让视频生成变成代理的自主能力，建议试试这个零人工介入的方案。

原文

6月10日

04:19

Paul Couvert@itsPaulAi

Hyperframes 现已正式成为 Claude 的官方连接器，用户无需任何技术操作，只需在 Claude 中提问即可生成视频。该工具以 MCP 方式运行，解决了传统 LLM 回答以密集文本呈现、用户不愿阅读的问题。通过与 Anthropic 合作，Hyperframes 将文档摘要转化为视频，让信息更易理解。演示视频已通过该工具生成，展示了其零门槛的使用体验。

AI产品视频生成 MCP/工具 Claude Hyperframes Anthropic

推荐理由：做内容或文档的团队终于有了把 LLM 回答变成视频的捷径——不用写代码，直接连 Claude 就能用，建议试试。

原文

03:48

HeyGen@HeyGen_Official

HeyGen 举办了一场面向开发者的线上研讨会，展示其 API 如何帮助团队自动化视频制作、个性化内容并规模化生产。活动涵盖了 API 功能、真实客户案例以及入门技巧。对于需要批量生成视频内容的企业和开发者来说，这是一个了解如何将 AI 视频生成集成到工作流中的机会。

AI产品 HeyGen API 视频生成自动化内容个性化

推荐理由：做视频内容自动化的团队可以直接用 HeyGen API 省掉大量人工剪辑时间，建议点开看看真实案例和入门技巧。

原文

03:40

HeyGen@HeyGen_Official

Hyperframes 已正式成为 Claude AI 的官方 MCP 连接器，旨在解决 LLM 回答中文本密集、用户不读的问题。该工具与 Anthropic 合作开发，允许用户将 Claude 的文本回答自动转换为视频摘要，提升信息理解效率。Hyperframes 以 MCP 协议运行，用户可在工作流中直接使用，无需切换工具。官方演示视频展示了其将文档摘要转化为视频的能力，证明该方案可行。

AI产品 Claude MCP/工具视频生成信息摘要 Anthropic

推荐理由：Hyperframes 解决了 LLM 输出难以消化的问题，做知识管理或内容分发的团队可以直接用 Claude 生成视频摘要，省去手动制作时间。

原文

6月9日

15:22

15:22IT之家（博客/媒体）

精选

谷歌将 Google AI Plus 订阅价格从每月 8 美元降至 5 美元，存储空间从 200GB 翻倍至 400GB。该订阅包含 Gemini 3 Pro、Nano Banana Pro 和 Deep Research 等功能，此前仅在更贵的 AI Pro 套餐中提供。新增权益包括 AI 邮件工具、Daily Brief 智能体以及视频生成模型 Gemini Omni，后者可从任何输入内容生成视频。现有订阅用户将在未来几天内获得新增存储空间并看到调整后的价格。

AI产品 Gemini Google AI Plus Google 订阅计划视频生成

推荐理由：月费降3美元，存储翻倍

原文

13:11

arXiv cs.LG@Wayne King, Zeyue Xue, Yuxuan Bian, Jie Huang, Haoran Li, Yaowei Li, Yaofeng Su, Yuming Li, Haoyu Wang, Shiyi Zhang, Songchun Zhang, Yuwei Niu, Sihan Xu, Junhao Zhuang, Haoyang Huang, Nan Duan

Echo-Memory 是一项针对动作条件世界模型中记忆机制的受控研究。这类模型根据首帧、文本提示和相机动作序列生成多段视频，但其主要失败点往往是记忆而非局部图像合成：当相机离开再返回时，场景或关键物体可能悄然改变。现有记忆设计难以比较，因为增益与骨干网络、训练、检索和评估差异纠缠不清。Echo-Memory 固定了动作到视频的接口，仅改变历史信息的存储和读取方式，在共享的视频扩散骨干、优化器、相机动作表示、采样器和评估流程下，比较了原始上下文、基于压缩的记忆、不同读取路径的空间摘要以及状态空间循环。研究通过三分支协议（回放质量、域内循环重访和开放域返回探测）评估记忆，发现回放保真度不足以作为记住世界的代理指标。主要结论包括：原始上下文是强大的容量基线，能显著提升开放域返回性能；紧凑性不能替代容量；块状状态空间循环是最强的开放域返回机制。

论文世界模型记忆机制视频生成状态空间模型受控实验

推荐理由：做视频生成或世界模型研究的团队，这篇论文帮你拆解了记忆机制中容量、压缩、读取和循环四个关键维度，看完能直接指导你的模型设计。

原文

05:45

HeyGen@HeyGen_Official

精选

HeyGen 在 X 上分享了一个完整的智能体反馈循环工作流，涵盖 lint、快照、渲染、ffmpeg 拉帧、发布和迭代。该流程强调只信任真实渲染或预览中的运动/视频/音频，并通过冻结已批准的剪辑、分支文件夹来重复迭代。这展示了 AI 视频生成中自动化质量控制和版本管理的实用方法，对从事视频生成和 AI 工作流的开发者有参考价值。

AI产品智能体视频生成工作流迭代 HeyGen

推荐理由：做 AI 视频生成或自动化工作流的团队可以借鉴这个闭环设计——它解决了从生成到迭代的信任和版本控制痛点，直接照着思路优化自己的流程会很高效。

原文

6月6日

07:43

快手可灵 Kling@Kling_AI

Kling AI 在2026年6月6日庆祝成立两周年，宣布过去一年内完成了26次模型迭代，全球用户数突破1亿，企业客户接近5万家。该平台持续赋能各行业创作者，推动创意落地。Kling AI 强调其不断进化、扩展和创造的理念，感谢用户支持，并展望更多可能性。

AI产品 Kling AI 视频生成模型迭代用户增长企业客户

推荐理由：Kling AI 一年迭代26次，用户破亿，证明其视频生成能力持续领先。做内容创作或视频生成的团队，值得关注其最新进展。

原文

01:42

HeyGen@HeyGen_Official

HeyGen 在五月发布多项更新，包括 HyperFrames 升级、Avatar V 支持自然语言指令（英文），并开放 API 和实时使用。同时，HeyGen 新增与 Superhuman、Codex、Canva、Lovable 等工具的集成，并推出 Android 版应用。这些更新降低了 AI 视频生成的使用门槛，让用户更便捷地创建和定制数字人内容。

AI产品 HeyGen 数字人 API 集成视频生成

推荐理由：做视频内容或数字人应用的团队，现在可以用自然语言直接指挥 Avatar V，还能在常用工具里直接调用，建议试试。

原文

6月5日

21:13

21:13IT之家（博客/媒体）

快手旗下视频生成 AI 产品可灵 AI 在发布两周年之际宣布，全球用户已突破 1 亿，企业客户接近 5 万。过去一年，可灵完成了 26 次迭代，深入影视、广告、音乐 MV、游戏、电商、智能硬件等场景。同时，可灵 AI 正在进行分拆后的首轮融资，投前估值达 180 亿美元，并计划于 2027 年初提交港股上市申请。

AI产品快手可灵 AI 视频生成用户增长融资上市

推荐理由：视频生成赛道竞争白热化，可灵 AI 用两年时间跑出 1 亿用户和 180 亿美元估值，做 AI 视频或内容创作的团队值得关注其迭代方向和商业化路径。

原文

07:18

rohanpaul_ai@rohanpaul_ai

AI 工具分散在多个平台，用户需要在 ChatGPT、Claude、Gemini、Grok 等之间频繁切换，体验割裂。OverchatAI 发布了一款多模型 AI 应用，将聊天、图像生成和视频生成整合到统一界面中，旨在解决工具碎片化问题。该应用支持主流模型，让用户无需切换标签页即可完成多种任务。对于重度 AI 用户来说，这能显著提升工作效率，减少上下文切换成本。

AI产品多模型聚合应用 OverchatAI 聊天图像生成视频生成

推荐理由：OverchatAI 解决了 AI 工具碎片化的痛点，经常在多模型间切换的创作者和开发者可以直接在一个界面里完成聊天、绘图和视频生成，省去来回跳转的麻烦。

原文

01:16

HeyGen@HeyGen_Official

HeyGen 发布了 Cinematic_avatar API，允许用户保留自己的肖像特征，同时增加电影级画质范围。该 API 支持通过编程代理（如 CLI + HyperFrames 技能）构建视频管线，用于创建类似官方发布的启动视频。开发者可以安装 HeyGen CLI 和 HyperFrames 技能来快速上手。这一更新为视频生成领域提供了更灵活、可编程的解决方案，尤其适合需要批量或定制化视频内容的团队。

AI产品 HeyGen 视频生成 API CLI 数字人

推荐理由：HeyGen 的 Cinematic_avatar API 让视频生成从“手动调参”进化到“代码驱动”，做视频管线或批量内容生产的团队可以直接用 CLI 集成，省去重复劳动。

原文

6月4日

16:30

Decoder@Matthias Bastian

72°

xAI 发布了 grok-imagine-video-1.5-preview，这是一个图像转视频模型，能将静态图片根据文本提示生成最高 720p 分辨率的电影感视频。用户还可以将多个片段拼接成更长的场景。该更新标志着 xAI 在视频生成领域的进一步扩展，为内容创作者提供了新的工具。

AI产品 xAI Grok Imagine 图像转视频 720p 视频生成

推荐理由：xAI 的 Grok Imagine 1.5 让静态图片秒变 720p 视频，做短视频或创意内容的团队可以直接拿来用，省去复杂后期。

原文

07:43

Replicate@replicate

Replicate 宣布与 xAI 合作，将其模型引入平台，并发布了针对最新视频模型 Grok Imagine Video 1.5 的终极提示指南。该指南旨在帮助用户更好地利用该模型生成高质量视频内容。此次合作使开发者能够更便捷地访问 xAI 的视频生成能力。对于从事 AI 视频创作的用户来说，这是一份实用的资源。

AI产品视频生成 Grok Imagine Video 1.5 提示工程 Replicate xAI

推荐理由：做 AI 视频生成的开发者可以直接用这份指南提升 Grok Imagine Video 1.5 的出片质量，值得收藏。

原文