GLM 5.1 + Claude Opus 4.7 顾问模式：法律基准 18/100，成本降 61%

精选理由

法律 AI 团队终于有了降本增效的实战方案——用 GLM 5.1 搭配 Claude Opus 4.7 做稀疏顾问，性能提升 28% 的同时成本砍掉 61%，做法律智能体或长链推理的开发者值得一试。

AI 摘要

Fireworks AI 在 Harvey 的法律智能体基准上测试了稀疏顾问模式：用 GLM 5.1 作为执行工人，Claude Opus 4.7 作为稀疏顾问，结果全部通过率从 Opus 单独运行的 14/100 提升至 18/100，成本仅为 Opus 单独运行的 39%。该模式通过让强大模型仅在关键步骤提供建议，显著降低了推理成本。Fireworks 已开源相关 harness 设计、顾问模式及训练结果。

AI 翻译 · 中文

Fireworks AIFrontier models are powerful advisors. On @harvey 's Legal Agent Benchmark, a GLM 5.1 worker using Claude Opus 4.7 as a sparse advisor reached 18/100 all-pass versus 14/100 for Opus alone, at 39% of the cost. More on…

lmarena.ai06-04 16:00原文

查看原推