AITP
精选全部 AI 动态AI 日报Agent 接入关于更新日志信源提报反馈
登录 / 注册
AITOP
全部 AI 动态
AI 相关资讯全量信息流
全部博客资讯推文论文
全部模型产品行业论文技巧
标签:同声传译×
6月25日
12:02
12:02IT之家(博客/媒体)
理想汽车公布 AI 眼镜 Livis 六月 OTA 升级内容,新增 6 项功能、优化 6 项功能。同声传译提供聆听模式和对话模式,支持韩语、日语、法语等 19 种语言将于 8 月上线。长按触控区可唤醒手机端语音助手,支持闹钟、待办等操作。录音时长放开至最高 7 小时,竖版视频画质通过影像芯片提升 42%。
AI产品Livis理想汽车同声传译语音助手OTA

推荐理由:理想眼镜新增同声传译和语音助手,开会、旅行直接翻译,还能长按唤醒手机发消息,录音最长7小时,全是实用更新。
原文
6月16日
20:46
AITOP6月16日 20:46
600亿美元买下Cursor,xAI终于拿到了编程工具,但真正值得跟踪的或许不是AI600亿美元买下Cursor,xAI终于拿到了编程工具,但真正值得跟踪的或许不是AI
6月12日
12:57
AITOP6月12日 12:57
Claude代码里藏了个20260612,18个月后的AI记忆革命已经开始倒计时
6月11日
15:28
AITOP6月11日 15:28
1107 vs 303:谷歌悄悄开源了一个“拆打字机”的模型,把大模型速度翻了4倍
15:23
AITOP6月11日 15:23
DiffusionGemma颠覆文本生成?自回归模型的“统治”要结束了
15:07
AITOP6月11日 15:07
每秒1107个token,Google开源的扩散模型为什么能改变本地推理格局?
6月3日
10:27
10:27arXiv cs.AI@Quentin Fuxa, Dominik Macháček
AlignAtt4LLM 是 IWSLT 2026 同声传译任务的参赛系统,支持英语到德语、意大利语和中文的实时翻译。它采用同步级联架构:Qwen3-ASR 通过强制对齐生成逐步更新的源文本,Gemma-4 E4B-it 在 MT 侧使用 AlignAtt 策略进行翻译。这是首次将 AlignAtt 应用于纯解码器 LLM,解决了缺少编码器-解码器交叉注意力的问题,通过显式源跨度提示、离线选择翻译专用注意力头、选择性 qk-fast replay 和运行时查询/键捕获实现。在 IWSLT 2026 开发集上,该系统在低延迟(约2秒)和高延迟(低于4秒)场景下,对欧洲目标语言(英译德、英译意)均优于基线,对英译中结果较复杂,但方法不限于 Gemma-4,可复用于更强的翻译解码器 LLM。
论文同声传译AlignAtt纯解码器LLM实时翻译Gemma-4

推荐理由:做同声传译或实时翻译系统的团队,终于有了一个在纯解码器 LLM 上跑 AlignAtt 的可行方案,低延迟场景下效果显著,值得参考实现。
原文
5月20日
16:14
16:14IT之家(博客/媒体)
阿里通义千问团队发布Qwen3.5-LiveTranslate-Flash实时语音翻译模型,解决了跨境直播、跨国会议等场景中的延迟、语种覆盖和音色保留三大痛点。该模型支持60种语言输入和29种语言输出,端到端字均延迟仅2.8秒,并具备实时音色克隆功能,能保留说话人原声特征。内置热词引擎可自定义1000个词条,提升专有名词和行业术语的翻译准确性。在FLEURS和CoVoST2基准上,翻译准确率优于主流语音大模型,相比前代Qwen3-LiveTranslate-Flash在延迟和语言覆盖上均有显著提升。
AI模型实时翻译语音模型同声传译音色克隆阿里通义千问

推荐理由:跨境直播、跨国会议和出海团队终于有了低延迟、高语种覆盖的实时同传方案,还能保留说话人原声,做内容出海或智能硬件的开发者可以直接试。
原文
精选全部日报登录