数字人·general

数字人

别名
首次出现
2026-05-22
最近出现
2026-06-11
累计提及
16
§ 01综述

数字人技术正从实验走向产品化,行业焦点集中在高拟真、低成本、快速生成以及多平台集成。近期进展呈现三大趋势:

  • 底层模型统一与开源:美团的 LongCat-Video-Avatar 1.5 开源,将生成时间缩短至 10 秒视频仅需 1 分钟,兼顾高拟真与可用性(美团开源 LongCat-Video-Avatar 1.5:10 秒数字人视频仅需 1 分钟生成)。同时,学术界提出 Archon 统一模型,试图将多模态数字人生成整合为单一框架(Archon:统一多模态数字人生成模型)。
  • 商业化加速:百度 MEG 组织调整,将数字人业务升级为独立部门,并合并商业与电商(百度 MEG 组织调整:数字人业务升级独立部门,合并商业与电商)。HeyGen 推出 Cinematic_avatar API 和 Avatar V API,价格低至 $0.05/秒,并集成 Superhuman 等工具(HeyGen Avatar V API 上线,$0.05/秒HeyGen 五月更新:Avatar V 支持英文指令,集成 Superhuman 等)。魔珐星云让国产大模型 Agent 拥有 3D 具身躯壳,推动数字人作为交互界面(魔珐星云让国产大模型Agent拥有3D具身躯壳)。
  • 多模态能力提升:Gemini Omni 上线数字人功能,可快速克隆外貌和声音(Gemini Omni 上线数字人功能,三步克隆你的外貌和声音)。HeyGen Avatar V 登陆 Replicate,实现高质量 AI 视频生成(HeyGen Avatar V 登陆 Replicate,生成高质量 AI 视频)。
  • 当前焦点:如何平衡生成质量、实时性与成本,以及数字人在电商、教育、客户服务等场景的落地效果。未来需观察开源生态对商业模型的冲击,以及多模态统一模型是否能降低行业门槛。

    § 02相关报道10 条在档
    1. 01
      魔珐星云让国产大模型Agent拥有3D具身躯壳
      掘金本周最热
    2. 02
      百度 MEG 组织调整:数字人业务升级独立部门,合并商业与电商
      IT之家
    3. 03
      HeyGen 五月更新:Avatar V 支持英文指令,集成 Superhuman 等
      HeyGen
    4. 04
      HeyGen 推出 Cinematic_avatar API,保留肖像并构建视频管线
      HeyGen
    5. 05
      Gemini Omni 上线数字人功能,三步克隆你的外貌和声音
      berryxia
    6. 06
      Archon:统一多模态数字人生成模型
      arXiv cs.AI
    7. 07
      LongCat-Video-Avatar 1.5 开源:数字人视频从高拟真到真可用
      美团技术团队
    8. 08
      美团开源 LongCat-Video-Avatar 1.5:10 秒数字人视频仅需 1 分钟生成
      IT之家
    9. 09
      HeyGen Avatar V 登陆 Replicate,生成高质量 AI 视频
      Replicate
    10. 10
      HeyGen Avatar V API 上线,$0.05/秒
      HeyGen
    § 03邻近话题

    本页综述由 AITOP 基于公开报道整理。原报道版权归各自来源所有。

    /topic/%E6%95%B0%E5%AD%97%E4%BA%BA