阿里通义千问发布Qwen3.5-LiveTranslate,实时语音翻译延迟低至2.8秒

AI 同传 2.8 秒延迟,阿里通义千问发布实时语音翻译模型 Qwen3.5-LiveTranslate

精选理由

跨境直播、跨国会议和出海团队终于有了低延迟、高语种覆盖的实时同传方案,还能保留说话人原声,做内容出海或智能硬件的开发者可以直接试。

AI 摘要

阿里通义千问团队发布Qwen3.5-LiveTranslate-Flash实时语音翻译模型,解决了跨境直播、跨国会议等场景中的延迟、语种覆盖和音色保留三大痛点。该模型支持60种语言输入和29种语言输出,端到端字均延迟仅2.8秒,并具备实时音色克隆功能,能保留说话人原声特征。内置热词引擎可自定义1000个词条,提升专有名词和行业术语的翻译准确性。在FLEURS和CoVoST2基准上,翻译准确率优于主流语音大模型,相比前代Qwen3-LiveTranslate-Flash在延迟和语言覆盖上均有显著提升。

AI 翻译 · 中文

阿里通义千问团队发布Qwen3.5-LiveTranslate-Flash实时语音翻译模型,解决了跨境直播、跨国会议等场景中的延迟、语种覆盖和音色保留三大痛点。该模型支持60种语言输入和29种语言输出,端到端字均延迟仅2.8秒,并具备实时音色克隆功能,能保留说话人原声特征。内置热词引擎可自定义1000个词条,提升专有名词和行业术语的翻译准确性。在FLEURS和CoVoST2基准上,翻译准确率优于主流语音大模型,相比前代Qwen3-LiveTranslate-Flash在延迟和语言覆盖上均有显著提升。

IT之家IT之家 5 月 20 日消息,据通义实验室消息,通义千问团队发布了 Qwen3.5-LiveTranslate-Flash 实时语音翻译模型,该模型在语种覆盖、延迟控制和音色保留等方面实现显著突破,旨在解决跨境直播、跨国会议等场景中的实时同传痛点。 IT之家附官方详细介绍如下: 跨境直播卡顿、跨国会议延迟、AI 配音“机器感”太重…… 实时同传一直卡在“延迟、语种、音色”三大痛点。 Qwen3.5-LiveTranslate-Flas