AITP
精选全部 AI 动态AI 日报Agent 接入关于更新日志信源提报反馈
登录 / 注册
AITOP
全部 AI 动态
AI 相关资讯全量信息流
全部博客资讯推文论文
全部模型产品行业论文技巧
标签:实时翻译×
6月25日
04:06
04:06marktechpost@Asif Razzaq
精选
Gradium推出两个实时语音翻译模型stt-translate和s2s-translate,覆盖英语、法语、德语、西班牙语、葡萄牙语共20个语言对。模型采用双阶段架构,将传统三模型级联简化为两个:单次转录+翻译后连接Gradium TTS,通过单个双工WebSocket运行。据Gradium报告,该模型在准确性和延迟上优于gpt-realtime-translate和gemini-3.5-live-translate。模型还支持输出语音选择和语音克隆功能。
AI模型Gradiumstt-translates2s-translate语音翻译实时翻译

推荐理由:Gradium发了两个实时语音翻译模型,准确率和速度都超过了GPT的实时翻译,还能选声音和克隆,做多语言交流很实用。
原文
6月16日
20:46
AITOP6月16日 20:46
600亿美元买下Cursor,xAI终于拿到了编程工具,但真正值得跟踪的或许不是AI600亿美元买下Cursor,xAI终于拿到了编程工具,但真正值得跟踪的或许不是AI
6月12日
12:57
AITOP6月12日 12:57
Claude代码里藏了个20260612,18个月后的AI记忆革命已经开始倒计时
6月11日
15:28
AITOP6月11日 15:28
1107 vs 303:谷歌悄悄开源了一个“拆打字机”的模型,把大模型速度翻了4倍
15:23
AITOP6月11日 15:23
DiffusionGemma颠覆文本生成?自回归模型的“统治”要结束了
15:07
AITOP6月11日 15:07
每秒1107个token,Google开源的扩散模型为什么能改变本地推理格局?
6月10日
01:33
01:33Decoder@Matthias Bastian
Google 发布了 Gemini 3.5 Live Translate,这是一个音频模型,支持超过70种语言的实时语音翻译。系统无需等待句子结束即可连续翻译,并声称能保留说话者的语调、语速和音高。在 Google Meet 中,语言支持从5种跃升至70多种。这标志着实时翻译技术的重要进步,尤其对跨国会议和多语言沟通场景有重大影响。
AI产品实时翻译语音模型Google MeetGemini 3.5多语言

推荐理由:跨国团队和频繁开会的用户终于有了靠谱的实时翻译工具——Gemini 3.5 不仅支持70+语言,还能保留说话者的语气和节奏,建议在 Google Meet 中直接体验。
原文
5月22日
08:06
08:06IT之家(博客/媒体)
腾讯会议正式推出“AI 同传”功能,支持模仿用户音色,时延低于3秒,实现发言与翻译几乎同步。每位参会者可独立开启同传,选择自己需要的语言,收听时仿佛用户本人用流利外语发言。该功能无需插件或外接设备,并支持调节同传与原声音量,方便核验关键信息。同时,AI 同传与文字转写、会中字幕打通,实现跨语言会议的可听、可译、可见、可记。
AI产品腾讯会议AI同传语音合成实时翻译音色模仿

推荐理由:跨国会议和远程协作的团队终于有了低延迟、高拟真的同传方案——不用外挂设备,还能模仿发言人音色,做国际业务或跨语言沟通的可以直接在腾讯会议里开启试试。
原文
5月21日
08:00
08:00IT之家(博客/媒体)
在2026年谷歌I/O开发者大会上,谷歌与三星展示了由Gentle Monster和Warby Parker设计的2款智能眼镜。这两款眼镜作为手机伴侣设备,整合Gemini AI模型,提供免手操作的智能辅助,支持语音导航、个性化推荐、自提订单下达和通知摘要。核心功能包括实时翻译,可翻译语音和视线中的文字。外观上,Gentle Monster版本偏时尚,Warby Parker版本偏日常。首批产品预计今秋上市,无显示版本售价或为379-499美元。
AI产品智能眼镜Gemini AI语音导航实时翻译谷歌/三星

推荐理由:智能眼镜终于有了实用的AI整合——Gemini驱动的语音导航和实时翻译解决了日常出行和跨语言交流痛点,经常旅行或需要免手操作的用户值得关注。
原文
5月20日
16:14
16:14IT之家(博客/媒体)
阿里通义千问团队发布Qwen3.5-LiveTranslate-Flash实时语音翻译模型,解决了跨境直播、跨国会议等场景中的延迟、语种覆盖和音色保留三大痛点。该模型支持60种语言输入和29种语言输出,端到端字均延迟仅2.8秒,并具备实时音色克隆功能,能保留说话人原声特征。内置热词引擎可自定义1000个词条,提升专有名词和行业术语的翻译准确性。在FLEURS和CoVoST2基准上,翻译准确率优于主流语音大模型,相比前代Qwen3-LiveTranslate-Flash在延迟和语言覆盖上均有显著提升。
AI模型实时翻译语音模型同声传译音色克隆阿里通义千问

推荐理由:跨境直播、跨国会议和出海团队终于有了低延迟、高语种覆盖的实时同传方案,还能保留说话人原声,做内容出海或智能硬件的开发者可以直接试。
原文
5月14日
15:02
15:02IT之家(博客/媒体)
精选
IT之家5月14日消息,Android Authority挖掘安卓10.17.48.914427315.6-release版谷歌翻译发现离线实时翻译功能。该功能在无网时支持英语、法语、德语、葡萄牙语、意大利语和西班牙语,需提前下载语言包。目前已有完整引导界面但功能尚未成熟,实时语音翻译离线实现难度较高。
AI产品谷歌翻译Google Translate安卓实时翻译离线翻译

推荐理由:谷歌翻译离线也能实时语音翻译
原文
精选全部日报登录