04:06marktechpost@Asif Razzaq精选Gradium推出两个实时语音翻译模型stt-translate和s2s-translate,覆盖英语、法语、德语、西班牙语、葡萄牙语共20个语言对。模型采用双阶段架构,将传统三模型级联简化为两个:单次转录+翻译后连接Gradium TTS,通过单个双工WebSocket运行。据Gradium报告,该模型在准确性和延迟上优于gpt-realtime-translate和gemini-3.5-live-translate。模型还支持输出语音选择和语音克隆功能。AI模型Gradiumstt-translates2s-translate语音翻译实时翻译1 个信源在谈推荐理由:Gradium发了两个实时语音翻译模型,准确率和速度都超过了GPT的实时翻译,还能选声音和克隆,做多语言交流很实用。原文
01:33Decoder@Matthias BastianGoogle 发布了 Gemini 3.5 Live Translate,这是一个音频模型,支持超过70种语言的实时语音翻译。系统无需等待句子结束即可连续翻译,并声称能保留说话者的语调、语速和音高。在 Google Meet 中,语言支持从5种跃升至70多种。这标志着实时翻译技术的重要进步,尤其对跨国会议和多语言沟通场景有重大影响。AI产品实时翻译语音模型Google MeetGemini 3.5多语言3 个信源在谈推荐理由:跨国团队和频繁开会的用户终于有了靠谱的实时翻译工具——Gemini 3.5 不仅支持70+语言,还能保留说话者的语气和节奏,建议在 Google Meet 中直接体验。原文
08:06IT之家(博客/媒体)腾讯会议正式推出“AI 同传”功能,支持模仿用户音色,时延低于3秒,实现发言与翻译几乎同步。每位参会者可独立开启同传,选择自己需要的语言,收听时仿佛用户本人用流利外语发言。该功能无需插件或外接设备,并支持调节同传与原声音量,方便核验关键信息。同时,AI 同传与文字转写、会中字幕打通,实现跨语言会议的可听、可译、可见、可记。AI产品腾讯会议AI同传语音合成实时翻译音色模仿推荐理由:跨国会议和远程协作的团队终于有了低延迟、高拟真的同传方案——不用外挂设备,还能模仿发言人音色,做国际业务或跨语言沟通的可以直接在腾讯会议里开启试试。原文
08:00IT之家(博客/媒体)在2026年谷歌I/O开发者大会上,谷歌与三星展示了由Gentle Monster和Warby Parker设计的2款智能眼镜。这两款眼镜作为手机伴侣设备,整合Gemini AI模型,提供免手操作的智能辅助,支持语音导航、个性化推荐、自提订单下达和通知摘要。核心功能包括实时翻译,可翻译语音和视线中的文字。外观上,Gentle Monster版本偏时尚,Warby Parker版本偏日常。首批产品预计今秋上市,无显示版本售价或为379-499美元。AI产品智能眼镜Gemini AI语音导航实时翻译谷歌/三星推荐理由:智能眼镜终于有了实用的AI整合——Gemini驱动的语音导航和实时翻译解决了日常出行和跨语言交流痛点,经常旅行或需要免手操作的用户值得关注。原文
16:14IT之家(博客/媒体)阿里通义千问团队发布Qwen3.5-LiveTranslate-Flash实时语音翻译模型,解决了跨境直播、跨国会议等场景中的延迟、语种覆盖和音色保留三大痛点。该模型支持60种语言输入和29种语言输出,端到端字均延迟仅2.8秒,并具备实时音色克隆功能,能保留说话人原声特征。内置热词引擎可自定义1000个词条,提升专有名词和行业术语的翻译准确性。在FLEURS和CoVoST2基准上,翻译准确率优于主流语音大模型,相比前代Qwen3-LiveTranslate-Flash在延迟和语言覆盖上均有显著提升。AI模型实时翻译语音模型同声传译音色克隆阿里通义千问推荐理由:跨境直播、跨国会议和出海团队终于有了低延迟、高语种覆盖的实时同传方案,还能保留说话人原声,做内容出海或智能硬件的开发者可以直接试。原文
15:02IT之家(博客/媒体)精选IT之家5月14日消息,Android Authority挖掘安卓10.17.48.914427315.6-release版谷歌翻译发现离线实时翻译功能。该功能在无网时支持英语、法语、德语、葡萄牙语、意大利语和西班牙语,需提前下载语言包。目前已有完整引导界面但功能尚未成熟,实时语音翻译离线实现难度较高。AI产品谷歌翻译Google Translate安卓实时翻译离线翻译推荐理由:谷歌翻译离线也能实时语音翻译原文