10:30arXiv: DeepSeek@Baijun Ji, Zixuan Zhou, Xiangyu Duan, Yu Liu, Longbo Sun, Rupu Wei, Bohong Zhao文档级机器翻译需要捕捉长距离的篇章依赖关系,现有方法缺乏对结构化篇章依赖的显式建模。本文提出 G^2C-MT,将上下文选择视为轻量级篇章图上的结构化路径发现问题,通过将段落表示为节点并建模语义相似度、邻接和关键词重叠关系,再使用深度偏置随机游走采样上下文路径,引导大模型翻译。该方法支持多路径采样,能聚合多样候选翻译以提升鲁棒性。实验表明,G^2C-MT 在 DeepSeek-V3、Gemini-2.5-Flash-lite 和 Qwen-2.5/3 系列等多个大模型上均优于强基线。论文文档级翻译图引导上下文篇章建模大模型机器翻译推荐理由:做文档翻译或长文本处理的团队终于有了不依赖昂贵 LLM 的上下文建模方案——G^2C-MT 用图结构替代暴力检索,翻译质量提升且成本可控,做 NLP 应用的建议点开看看方法细节。原文
13:34Cohere@cohereCohere 宣布其 Command A+ 模型在机器翻译方面取得新突破,性能显著超越开源对手如 Mistral Medium 3.5、DeepSeek 和 OpenAI 的 gpt-oss,甚至优于专业翻译系统 Google Translate。与 RWS 合作开发的系统表现更佳,但 A+ 已拉开明显差距。这标志着 Cohere 在翻译领域的竞争力大幅提升,尤其对需要高质量翻译的企业用户意义重大。AI模型CohereCommand A+机器翻译模型对比企业级AI8 个信源在谈推荐理由:做多语言内容或翻译服务的团队值得关注——Cohere 的 A+ 模型在翻译质量上已经超过主流开源和专有方案,可以直接用于生产环境,省去自研或调优的麻烦。原文
13:06Hunyuan@TXhunyuan腾讯混元宣布与WMT26(第26届机器翻译研讨会)组织者正式合作,共同举办视频字幕翻译竞赛。该竞赛基于腾讯混元先进的Hy-MT系列模型,参赛者还可参与通用机器翻译竞赛。优胜者将获得特别大奖,旨在推动机器翻译技术的发展。腾讯混元邀请研究者、开发者、AI爱好者及所有对机器翻译感兴趣的人士注册参与。行业腾讯混元WMT26机器翻译视频字幕竞赛推荐理由:这是腾讯混元在机器翻译领域的一次重要合作,做视频翻译或字幕处理的团队可以借此机会测试前沿模型,参赛还有机会赢取大奖,值得关注。原文
13:37Jeff Dean@JeffDean精选Google Translate 迎来20周年,Jeff Dean 回顾了其关键里程碑:2006年首次部署基于5-gram语言模型的系统,使用了万亿词级训练数据,是早期大语言模型实践;2016年转向深度神经网络,结合序列到序列模型和自研TPU,推理性能提升30-80倍,延迟降低15-30倍,使服务可覆盖数亿用户;近期又借助Gemini模型进一步优化。这些技术迭代持续提升了翻译质量和全球连接性。AI产品Google Translate机器翻译大语言模型TPU序列到序列推荐理由:Jeff Dean 亲自梳理了 Google Translate 从统计方法到神经网络的两次关键跃迁,做 NLP/翻译系统的开发者能从中看到技术选型的真实演进逻辑,值得一读。原文