AI模型精选

Hy-MT2 多语言翻译模型发布:1.8B 量化后仅 440MB,性能超微软豆包 API

Hy-MT2: A Family of Fast, Efficient and Powerful Multilingual Translation Models in the Wild

精选理由

做多语言翻译或端侧部署的团队终于有了一个又快又准的选择——1.8B 量化后 440MB 就能跑,性能还超过微软豆包 API,值得直接上手试。

AI 摘要

Hy-MT2 是一系列面向复杂真实场景的快速多语言翻译模型,包含 1.8B、7B 和 30B-A3B(MoE)三个尺寸,支持 33 种语言间的翻译。通过 AngelSlim 1.25-bit 极端量化,1.8B 模型仅需 440MB 存储,推理速度提升 1.5 倍,适合端侧部署。在通用、商业、领域和指令跟随翻译任务中,7B 和 30B 模型在快速思考模式下超越 DeepSeek-V4-Pro 和 Kimi K2.6 等开源模型,1.8B 模型整体也优于微软和豆包等主流商业 API。该工作为多语言翻译提供了高效且强大的新选择。

AI 翻译 · 中文

Hy-MT2 是一系列面向复杂真实场景的快速多语言翻译模型,包含 1.8B、7B 和 30B-A3B(MoE)三个尺寸,支持 33 种语言间的翻译。通过 AngelSlim 1.25-bit 极端量化,1.8B 模型仅需 440MB 存储,推理速度提升 1.5 倍,适合端侧部署。在通用、商业、领域和指令跟随翻译任务中,7B 和 30B 模型在快速思考模式下超越 DeepSeek-V4-Pro 和 Kimi K2.6 等开源模型,1.8B 模型整体也优于微软和豆包等主流商业 API。该工作为多语言翻译提供了高效且强大的新选择。

arXiv: DeepSeekHy-MT2 is a family of fast-thinking multilingual translation models designed for complex real-world scenarios. It includes three model sizes: 1.8B, 7B, and 30B-A3B (MoE), all of which support translation among 33 languag