网易有道开源 Confucius4 双模型：数学视觉推理+语音克隆

精选理由

做教育 AI 或语音应用的开发者可以直接拿到完整权重，省去从零训练的成本，建议试试这两个模型的实际效果。

AI 摘要

网易有道今日开源 Confucius4 双模型，分别专注于数学视觉推理和语音克隆任务。不同于其他公司追求参数规模，有道更注重工程精度和落地成本。开源直接提供完整权重，而非仅开放 API，降低了开发者使用门槛。数学视觉推理模型可处理几何、图表等复杂视觉数学问题，语音克隆模型则能实现高保真声音复制。此举有望推动多模态和语音技术在教育和内容创作领域的实际应用。

AI 翻译 · 中文

小互网易有道今天开源了 Confucius4 双模型：一个做数学视觉推理，一个做语音克隆有的公司在卷参数规模，有道这次卷的是工程精度和落地成本开源直接放的是完整权重，不是只给 API 诚意满满多模态： huggingface.co/netease-youdao… 语音： github.com/netease-youdao… 💬 2 🔄 0 ❤️ 5 👀 1261 📊 3 ⚡ Powered by xgo.ing

查看原推