voice·general

voice

别名
首次出现
2026-05-22
最近出现
2026-06-12
累计提及
96
§ 01综述

语音技术综述

语音技术正从单一的语音识别和合成向情感化、个性化、多模态交互方向演进。近期行业动态显示,大模型厂商和创业公司都在加速布局语音智能体与语音克隆领域,同时安全与伦理问题也成为焦点。

主要进展

  • Grok Voice API 推出语音克隆,支持自然情感表达:xAI 发布了 Grok Voice API,能够克隆用户声音并生成带有丰富情感的语音,强调真实感和自然度。这标志着语音合成进入了个性化和情感化的新阶段。相关报道:Grok Voice API 上线语音克隆,自然情感丰富
  • OpenAI 收购 Weights.gg 并公开语音技术研究:OpenAI 低调收购了声音克隆平台 Weights.gg,将其技术整合进自家语音引擎。同时,OpenAI 通过多篇博文分享了合成语音的挑战、机遇以及安全研究,包括语音引擎的工作原理和选择 ChatGPT 语音背后的考量。这些动作表明 OpenAI 正在强化语音技术栈,并注重安全部署。相关报道:OpenAI 低调收购声音克隆平台 Weights.ggOpenAI分享合成语音的挑战与机遇OpenAI详解语音引擎工作原理及安全研究ChatGPT语音选择背后的故事
  • 苹果预告 iOS 27 辅助功能,语音控制支持自然语言操作:苹果计划在 iOS 27 中引入新的辅助功能,允许用户通过自然语言语音命令操作手机,进一步提升语音控制的便捷性和智能性。这体现了语音技术在无障碍和日常交互中的应用趋势。相关报道:苹果预告 iOS 27 辅助功能,语音控制支持自然语言操作
  • 端到端语音智能体评估框架 EVA-Bench 发布:学术界提出了 EVA-Bench,用于评估端到端语音智能体在对话、身份识别、情感理解等方面的能力,为语音智能体的标准化评测提供了新工具。相关报道:EVA-Bench:端到端语音智能体评估新框架
  • 其他动态:Together AI 推出 Voice Finder 语音搜索工具,帮助用户通过语音描述找到音效;开发者也基于 Claude Code 和 AssemblyAI 构建语音智能体,展示了技术落地的可能性。相关报道:Together AI推出Voice Finder语音搜索工具用Claude Code和AssemblyAI从零构建语音智能体
  • 当前焦点与未来观察

    语音技术的焦点主要集中在:语音克隆的真实性与安全性,尤其是如何防止滥用和诈骗;语音智能体的情感表达能力,使其交互更自然;以及 端到端框架的标准化与评估。未来值得关注的是:开源语音模型与闭源方案的竞争、语音技术在无障碍和消费级产品中的普及,以及监管政策对语音合成技术的规范和约束。
    § 02相关报道10 条在档
    1. 01
      Grok Voice 以人性化时机、语气和温暖感实现顶尖性能,价格仅为竞品零头
      xAI
    2. 02
      Notion 用 Codex 实现一键生成需求文档、AI 语音输入,小团队工程力倍增
      OpenAI: 官网动态
    3. 03
      微软发布MAI系列模型:MAI-Thinking-1推理模型及6款新模型
      Mustafa Suleyman
    4. 04
      MAI-Voice-2:15种语言情感可控TTS,支持长文本稳定音色
      OpenRouter
    5. 05
      微软三款新模型 MAI-Image/Transcribe/Voice 上线 OpenRouter
      OpenRouter
    6. 06
      微软发布首款推理模型 MAI-Thinking-1,自研 AI 阵容扩充
      IT之家
    7. 07
      BaltiVoice:为巴尔蒂语构建的语音语料库与微调Whisper ASR系统
      arXiv: OpenAI
    8. 08
      OpenAI Voice Hack Night 决赛名单揭晓
      @OpenAIDevs
    9. 09
      Agentic OS for a Phone 赢得 OpenAI Voice Hack Night 人民选择奖
      @OpenAIDevs
    10. 10
      OpenAI Hack Night 团队演示手机“agentic 操作系统”,UI 即时生成
      小互
    § 03邻近话题

    本页综述由 AITOP 基于公开报道整理。原报道版权归各自来源所有。

    /topic/voice