全部 AI 动态 · AI 热点

6月29日

16:36

16:36IT之家（博客/媒体）

新加坡Sapiens AI旗下Agnes AI于6月1日宣布全模态模型API无限期免费开放，6月29日推出免费视频创作平台Pavo。用户只需一句话，Pavo即可自动完成需求、大纲、角色场景道具设计、角色场景道具图、分镜、关键帧、分镜视频七大步骤。平台使用Agnes-2.0-Flash文本模型、Agnes-Image-2.1-Flash图片模型、Agnes-Video-2.0视频模型，生成完全免费。即将上线的Agnes-Video-2.5-Preview在动作、角色、相机移动、场景连贯性上接近Veo 3。

AI产品 Agnes AI Pavo Agnes-Video-2.5-Preview 视频生成免费平台

推荐理由：免费做视频，一句话搞定全流程，Agnes AI的Pavo平台从脚本到分镜全自动，比Veo 3还接近，赶紧去试试。

原文

6月25日

09:57

09:57IT之家（博客/媒体）

凌川科技近日完成数亿元A+轮融资，由啟赋资本领投。该公司前身为快手异构计算与芯片事业部，2024年3月独立运营，其SL200视频智能SOC已在快手部署数万颗、服务7亿用户。下一代芯片采用全国产3D堆叠技术，已于4月完成流片，针对散热等关键问题设计，体现韬(τ)定律在数据中心的应用。

AI产品凌川科技 SL200 3D堆叠韬定律视频生成

推荐理由：快手系芯片公司凌川科技搞出了全国产3D堆叠芯片，已经流片了，还拿了数亿融资，专攻视频和生成式AI算力。

原文

6月23日

20:33

Decoder@Maximilian Schreiner

74°

字节跳动在火山引擎FORCE大会上发布了五款新AI模型，其中Seedance 2.5视频模型计划于7月初上线。Seedance 2.5将AI视频生成时长从行业常见的十几秒提升至30秒，支持更高分辨率和一致性。该模型基于扩散架构，有望在短视频创作和广告领域应用。

AI模型 Seedance ByteDance 视频生成 30秒

推荐理由：字节跳动新发布的Seedance 2.5视频模型能直接生成30秒视频，比之前模型长一倍，做短视频创作者可以试试。

原文

12:27

12:27IT之家（博客/媒体）

72°

AI模型豆包 Seedance 2.5 视频生成字节跳动周星驰

推荐理由：字节跳动新视频模型 Seedance 2.5 能直接生成 30 秒长视频，还支持 50 个全模态素材输入，马上 7 月就能用上了。周星驰经典片段也能用 AI 二次创作，挺有意思。

原文

11:35

techcrunch@Dominic-Madori Davis

Google DeepMind 与独立电影公司 A24 达成合作协议，将共同开发 AI 电影制作工具。该合作涉及 7500 万美元投资，旨在利用 DeepMind 的 AI 技术辅助 A24 的影片制作流程。工具将覆盖剧本分析、场景生成及后期编辑等环节，首部实验性短片预计 2027 年完成。

行业 DeepMind A24 AI电影 7500万视频生成

推荐理由：Google DeepMind 和 A24 联手砸 7500 万美元做 AI 电影工具，以后拍片效率可能翻倍，还能看到不一样的叙事风格。

原文

6月22日

21:30

21:30IT之家（博客/媒体）

生数科技的新一代视频生成大模型 Vidu Q3 上线华为云 MaaS，支持文生视频和图生视频一体化成片。该模型是全球首个“为剧而生”的视频大模型，可生成 16 秒 1080P 画质内容，并实现声画同出、多镜头叙事。Vidu Q3 推出两个版本：Turbo 极速版优化推理速度与成本，适合快速创意打样；Pro 专业版支持 4K 分辨率，面向广告大片等专业场景。模型还具备多国语言文字渲染及多语言输出功能，可用于漫剧、短剧和影视创作。

AI模型 Vidu Q3 华为云生数科技视频生成多模态

推荐理由：生数 Vidu Q3 上线华为云，能一键文/图生视频，支持 16 秒 1080P 和 4K，还有专为剧集设计的镜头叙事能力，做短视频或专业视频都合适。

原文

14:57

14:57IT之家（博客/媒体）

阿里巴巴今日发布视频生成模型 HappyHorse 1.1，较 1.0 版本在动态表现力、主体一致性、指令遵循等维度系统性升级。模型单次生成时长 3 到 15 秒，支持 720p 和 1080p 分辨率和自由宽高比。官方同步宣布联合虎鲸文娱集团举办 “Horsepower” AI 影像大赛，优胜者获百万商单合作，导演张纪中担任评委。即日起可通过 HappyHorse 官网、阿里云百炼和千问云使用最新版本。

AI模型 HappyHorse 阿里巴巴视频生成 AI影像大赛张纪中

推荐理由：阿里刚发了视频生成模型 HappyHorse 1.1，动态和一致性更强了，还搭了百万大奖的比赛，玩 AI 视频的可以试试。

原文

6月17日

12:43

12:43IT之家（博客/媒体）

xAI 于 6 月 17 日正式上线 Grok Imagine Video 1.5 模型，此前该模型于 6 月 3 日推出预览版。相比前代，模型升级了音画同步，可同时生成音效、环境音和对话，口型同步更自然。运动连贯性提升，减少了肢体扭曲和漂浮假象，能更好模拟重量与动量。在 Fast 模式下，生成 6 秒 720p 视频仅需约 25 秒，而前代需要 40 秒以上，现已通过 xAI API 提供。

AI模型 Grok Imagine Video 1.5 xAI 视频生成

推荐理由：xAI 刚上线的 Grok Imagine Video 1.5，6 秒 720P 视频生成只要 25 秒，音画同步和运动真实感比前代强不少，做短视频挺合适。

原文

08:31

08:31IT之家（博客/媒体）

据晚点LatePost，豆包日活超2亿，每天收入不足百万元（主要来自电商佣金），而日消耗算力成本达数千万元（不含训练算力中心成本）。字节高层访问Anthropic后调整AI资源分配，重心从豆包转向企业服务。字节Seedance年化收入（ARR）已达20亿美元（约135.4亿元人民币），单月超10亿元，基本抵消豆包算力成本，且绝大多数收入来自企业客户。同时，字节发布Seedance 2.0 Mini视频生成模型，定位高性价比，瞄准视频创作与规模化生产。

行业字节跳动豆包 Seedance 企业服务视频生成

推荐理由：字节把AI重心从豆包挪到企业服务了，Seedance一年营收20亿美元，已经能覆盖豆包的算力成本。想看具体数据和分析？点进来。

原文

6月16日

20:46

AITOP6月16日 20:46

600亿美元买下Cursor，xAI终于拿到了编程工具，但真正值得跟踪的或许不是AI

09:52

09:52IT之家（博客/媒体）

火山引擎于 6 月 15 日上线 Seedance 2.0 Mini 模型，官方称其生成速度快于 Seedance 2.0 Fast 约 2 倍，输出质量相当。定价方面，图生视频 0.023 元/千 tokens，视频生视频 0.014 元/千 tokens，720P 规格下单秒成本约 0.5 元，较标准版降低约一半。该模型主要面向电商内容、营销素材、UGC 创作等高频率生产场景。

AI模型 Seedance 2.0 Mini 字节跳动火山引擎视频生成性价比

推荐理由：字节跳动刚出的视频模型，成本只有上一代一半，速度还快两倍，电商和做UGC的可以试试批量出素材。

原文

6月14日

21:58

Decoder@Jonathan Kemper

精选

Mirage由微软研究院与多所大学联合开发。它直接在潜在空间存储场景信息，而非基于像素的点云。该方法将计算时间和显存需求大幅降低，同时支持长镜头下的空间一致性。模型目前无法可靠追踪跨片段的移动物体。

AI模型 Mirage Microsoft Research 视频生成世界模型潜在空间

推荐理由：视频生成空间记忆新方案

原文

6月12日

20:46

20:46IT之家（博客/媒体）

字节跳动旗下火山引擎与香港电视广播有限公司（TVB）达成深度合作，将围绕豆包视频生成模型Seedance 2.0的应用落地，在影视内容智能化生产、短剧制作、IP商业化探索及云基础设施建设等方面展开合作。双方将协同TVB旗下FF工作室，以AI短剧为契机，利用Seedance 2.0的视频生成能力，探索AI在短剧创作和制作流程中的应用。此外，火山引擎还将为TVB提供虚拟机、对象存储、网络资源、云数据库、视频云、CDN内容分发等云产品与服务。这标志着视频生成模型在传统影视行业的首次大规模落地尝试。

AI产品视频生成 Seedance 2.0 TVB 火山引擎短剧制作

推荐理由：传统电视台终于开始拥抱AI视频生成——TVB与火山引擎的合作让Seedance 2.0有了真实影视场景的落地机会，做短剧、影视内容的团队值得关注，看看AI能否真正改变制作流程。

原文

12:57

AITOP6月12日 12:57

Claude代码里藏了个20260612，18个月后的AI记忆革命已经开始倒计时

6月11日

15:28

AITOP6月11日 15:28

1107 vs 303：谷歌悄悄开源了一个“拆打字机”的模型，把大模型速度翻了4倍

15:23

AITOP6月11日 15:23

DiffusionGemma颠覆文本生成？自回归模型的“统治”要结束了

15:07

AITOP6月11日 15:07

每秒1107个token，Google开源的扩散模型为什么能改变本地推理格局？

6月9日

15:22

15:22IT之家（博客/媒体）

精选

谷歌将 Google AI Plus 订阅价格从每月 8 美元降至 5 美元，存储空间从 200GB 翻倍至 400GB。该订阅包含 Gemini 3 Pro、Nano Banana Pro 和 Deep Research 等功能，此前仅在更贵的 AI Pro 套餐中提供。新增权益包括 AI 邮件工具、Daily Brief 智能体以及视频生成模型 Gemini Omni，后者可从任何输入内容生成视频。现有订阅用户将在未来几天内获得新增存储空间并看到调整后的价格。

AI产品 Gemini Google AI Plus Google 订阅计划视频生成

推荐理由：月费降3美元，存储翻倍

原文

6月5日

21:13

21:13IT之家（博客/媒体）

快手旗下视频生成 AI 产品可灵 AI 在发布两周年之际宣布，全球用户已突破 1 亿，企业客户接近 5 万。过去一年，可灵完成了 26 次迭代，深入影视、广告、音乐 MV、游戏、电商、智能硬件等场景。同时，可灵 AI 正在进行分拆后的首轮融资，投前估值达 180 亿美元，并计划于 2027 年初提交港股上市申请。

AI产品快手可灵 AI 视频生成用户增长融资上市

推荐理由：视频生成赛道竞争白热化，可灵 AI 用两年时间跑出 1 亿用户和 180 亿美元估值，做 AI 视频或内容创作的团队值得关注其迭代方向和商业化路径。

原文

6月4日

16:30

Decoder@Matthias Bastian

72°

xAI 发布了 grok-imagine-video-1.5-preview，这是一个图像转视频模型，能将静态图片根据文本提示生成最高 720p 分辨率的电影感视频。用户还可以将多个片段拼接成更长的场景。该更新标志着 xAI 在视频生成领域的进一步扩展，为内容创作者提供了新的工具。

AI产品 xAI Grok Imagine 图像转视频 720p 视频生成

推荐理由：xAI 的 Grok Imagine 1.5 让静态图片秒变 720p 视频，做短视频或创意内容的团队可以直接拿来用，省去复杂后期。

原文

6月3日

22:39

22:39IT之家（博客/媒体）

京东发布并开源了 JoyAI-Echo 长音视频生成框架，解决了长视频生成中角色身份、声音不一致和生成速度慢的行业难题。该框架内置记忆库，可在多镜头中保持角色外观和音色一致，实测 5 分钟视频无崩坏。通过 DMD 技术实现约 7.5 倍推理加速，并支持对话式编辑，用户可直接用自然语言修改镜头，无需重跑整条视频。京东官方称该框架已进入全球第一梯队，项目已开源在 GitHub。

AI产品视频生成开源/仓库京东 JoyAI-Echo 对话式编辑

推荐理由：长视频生成领域终于有了能保持角色一致的开源方案，做视频生成、影视制作的团队可以直接拿来用，省去大量后期修复时间。

原文

16:11

16:11IT之家（博客/媒体）

字节跳动火山引擎的 MaaS 业务营收目标在 2026 年已上调至 150 亿元，是 2025 年实际营收的 10 倍。其中，视频生成模型 Seedance 2.0 单月营收已超过 10 亿元，且仍在增长，而该模型 API 尚未在海外全量上线。Seedance 2.0 在多项指标上超越海外顶尖视频模型，字节还计划发布质量提升 20% 的 2.1 版本。这一数据表明，字节在 AI 视频生成领域的商业化能力正在快速释放。

AI产品字节跳动 Seedance 2.0 视频生成 MaaS 商业化

推荐理由：视频生成模型商业化迎来里程碑——Seedance 2.0 单月营收超 10 亿，说明 AI 视频 API 已从概念走向真金白银。做视频生成、内容创作或云服务的团队值得关注，字节的定价和增长策略可能成为行业风向标。

原文

5月30日

02:18

Decoder@Matthias Bastian

Google 修复了 Gemini 应用中的一个 Bug，该 Bug 导致仅上传一两个 Omni 视频就消耗完整个使用配额。修复后，Ultra 会员的视频生成次数翻倍，且失败的请求不再计入配额。Google 还计划增加其他使用情况的透明度。这一更新解决了用户因配额快速耗尽而无法正常使用的问题。

AI产品 Gemini Bug修复配额优化视频生成 Ultra会员

推荐理由：Gemini 重度用户终于不用再为几个视频就耗尽配额而烦恼了，Ultra 会员还能获得双倍生成次数，建议立即更新应用体验。

原文

5月27日

10:52

Pandaily@contact@pandaily.com (Pandaily)

精选

美团发布LongCat-Video-Avatar 1.5版本，这是一个开源的数字人视频生成框架。该框架在口型同步精度上达到最先进水平，只需8步推理即可生成逼真视频。

AI模型 LongCat-Video-Avatar Meituan 数字人视频生成开源模型

推荐理由：8步推理生成逼真数字人

原文

5月26日

11:34

11:34IT之家（博客/媒体）

76°

小米汽车发布了全新的世界模型框架 Xiaomi Auto World Model，首次将三维重建与视频生成深度耦合，打破了行业长期将两者独立的技术路线。该框架通过重建提供几何锚点、生成填补未观测场景，实现了高稳定性、高一致性和高真实性，在 Waymo、nuScenes 等主流基准测试中全面取得 SOTA。目前该模型已在小米汽车的合成数据生成、仿真测试和智能座舱辅助驾驶学堂三大场景落地，交付了超过 10 万 clips 高质量合成数据。这一技术路径有望推动辅助驾驶从“场景感知”向“认知推演”的高阶形态跃迁。

AI产品世界模型自动驾驶三维重建视频生成小米汽车

推荐理由：小米汽车把世界模型的两条路线拧成一股绳，解决了重建缺想象、生成易漂移的行业难题。做自动驾驶感知或仿真的团队，建议看看他们的论文和技术主页，或许能启发新的技术路径。

原文

5月25日

11:47

美团技术团队@美团技术团队

美团开源了 LongCat-Video-Avatar 1.5，这是一款从 SOTA 迈向商业级应用的数字人视频模型。它在唇形同步、物理合理性、长视频稳定性、多人互动和高效推理上实现了全面提升，能稳定输出高质量内容。该模型解决了数字人视频在复杂商业场景中不自然、不稳定、成本高的问题，让数字人从实验室走向真实应用。开源版本可供开发者直接使用，推动数字人视频生成技术的普及。

AI模型数字人视频生成开源/仓库唇形同步美团

推荐理由：做数字人视频生成或虚拟主播的团队，终于有了一个能直接商用的开源模型——唇形同步和长视频稳定性提升明显，建议试试 LongCat 1.5 来降低制作成本。

原文

5月22日

14:37

14:37IT之家（博客/媒体）

76°

美团技术团队正式开源了数字人视频生成模型 LongCat-Video-Avatar 1.5，该版本在唇形同步、物理合理性、长视频稳定性、多人互动及推理效率方面全面升级。模型采用 DMD 蒸馏技术，将生成步数从 50 步压缩至 8 步，推理效率提升约 15 倍，生成 10 秒视频仅需约 1 分钟。在用户偏好对比中，该模型相比 Kling Avatar 2.0 胜率为 65.9%，相比 OmniHuman-1.5 胜率为 61.1%，相比 HeyGen 胜率为 54.3%。美团表示，数字人视频生成正从展示效果走向真实使用，希望开源能成为可验证、可改进、可共建的技术基座。

AI模型数字人视频生成开源/仓库美团 LongCat-Video-Avatar

推荐理由：数字人视频生成终于从演示走向了可商用——10 秒视频 1 分钟生成，效率提升 15 倍，做虚拟主播、在线教育、客服视频的团队可以直接拿来用，省去大量渲染时间。

原文

12:29

pandaily@contact@pandaily.com (Pandaily)

oiioii 是一个新兴的视频生成平台，提供超过 150 种视频动画风格，旨在满足创作者对特定艺术风格的控制需求。该平台在视频智能体时代推出，强调风格多样性和定制化，帮助用户从文本或图像生成具有独特视觉效果的视频。这一举措反映了 AI 视频生成领域从通用模型向专业化、风格化方向发展的趋势。

AI产品视频生成动画风格创作者工具 oiioii AI 视频

推荐理由：对于追求视频艺术风格多样性的创作者，oiioii 提供了超过 150 种动画风格，解决了通用模型风格单一的问题。做短视频、广告或动画的团队可以直接尝试，找到适合项目的独特视觉语言。

原文

5月21日

15:14

marktechpost@Asif Razzaq

精选

字节跳动智能创作实验室推出Lance，一个原生统一多模态模型，仅用3B激活参数即可处理图像与视频的理解、生成和编辑。Lance在图像理解基准MSCOCO上达到44.8的BLEU-4，在视频生成测试集UCF-101上取得FVD 159.3。该模型支持文本到图像、文本到视频、图像编辑、视频编辑等多种任务。Lance以Apache 2.0许可证开源，代码和权重已在GitHub发布。

AI模型 Lance ByteDance 多模态视频生成开源模型

推荐理由：3B参数打通图视频理解生成

原文

5月20日

11:53

pandaily@contact@pandaily.com (Pandaily)

72°

字节跳动（TikTok母公司）即将推出其AI视频生成模型Seedance 2.1版本，据称质量提升20%。该模型在视频生成领域进一步优化，旨在提升生成视频的逼真度和流畅性。此次更新可能加强字节跳动在AI视频生成赛道的竞争力，与OpenAI的Sora等产品展开竞争。Seedance 2.1的发布预计将吸引内容创作者和视频制作团队的关注。

AI模型视频生成 Seedance 字节跳动 AI模型内容创作

推荐理由：视频生成质量提升20%意味着更逼真的AI视频，做短视频或内容创作的团队可以直接关注，看看能否替代现有工具。

原文

5月18日

13:28

13:28IT之家（博客/媒体）

精选

陆军政治工作部宣传局联合中央广播电视总台军事节目中心，运用AI技术制作系列微短剧《战魂》，今日首播。该剧共5集，每集讲述一支英模连队的故事，还原经典战役战斗。首集《大渡河连》再现十七勇士强渡大渡河的历史场景。CCTV-7国防军事频道和央视军事每日播出一集，持续5天。去年九三阅兵前，中国军号曾发布AI生成李云龙与李幼斌跨时空对话视频。

AI产品战魂 AI微短剧视频生成军事大渡河连

推荐理由：AI还原经典战役

原文