精选理由
CMA 用独立 judge 打分更准
CMA Outcomes 框架内置了独立 judge 机制,通过在新 context 中运行的 grader 子 agent 对主 agent 输出进行评分,避免自我批评时模型打分偏高的问题。主 agent 根据 grader 的反馈进行修正,从而提升输出质量。该机制利用了独立上下文的子 agent 评分更客观的特点。
AI 翻译 · 中文
CMA Outcomes 框架内置了独立 judge 机制,通过在新 context 中运行的 grader 子 agent 对主 agent 输出进行评分,避免自我批评时模型打分偏高的问题。主 agent 根据 grader 的反馈进行修正,从而提升输出质量。该机制利用了独立上下文的子 agent 评分更客观的特点。
5/🎯 为什么独立 judge 比自我批评强 模型对自己输出打分容易偏高——用独立上下文的子 agent 评分,更客观。 CMA Outcomes 内置了这个机制:grader 在新 context 里评分,主 agent 根据反馈修正。 💬 1 🔄 0 ❤️ 0 👀 8 📊 1 ⚡ Powered by xgo.ing