路由+微调开源模型：更准、更快、更便宜，Harvey 法律案例验证

精选理由

法律 AI 团队终于有了可落地的降本增效方案——路由+微调开源模型比纯用前沿模型便宜 11 倍还更准，做垂直领域 AI 应用的开发者可以直接参考 Harvey 的实践。

AI 摘要

Hugging Face CEO Clement Delangue 指出，通过路由（routing）和后训练（post-training）开源模型，不仅能提升系统准确性，还能显著降低成本和提高速度。法律 AI 公司 Harvey 与 Fireworks AI 合作，在 100 个法律任务上测试发现：混合智能体（GLM 5.1 为主，路由到 Opus 4.7 作为顾问）在质量和成本上均优于单一前沿模型，18% 全通过率 vs 14%，成本 $368 vs $954。后训练（SFT）将 Kimi 2.6 的全通过率从 11% 提升至 15%，超过 Opus 的 14%，成本仅 $84，是 Opus 的 1/11。这挑战了“前沿模型在所有场景都更好”的营销叙事，为开发者提供了更务实、经济的 AI 系统构建思路。

AI 翻译 · 中文

Clement DelangueRouting and post-training open-source models won't only give you more accurate systems but also meaningfully faster and cheaper systems as most companies are currently learning (in addition to giving you more control…

查看原推