Anthropic 为 Opus 4.8 校准思考努力，邀请用户反馈

精选理由

Anthropic 正在主动校准 Opus 4.8 的思考深度，这对追求模型推理效率与质量平衡的开发者来说是个好消息——如果你在用 Claude 做复杂推理，反馈你的使用体验可以直接影响模型优化方向。

AI 摘要

Anthropic 在 Opus 4.8 模型上投入了大量工作来校准其思考努力程度，旨在让模型在推理时既不过度思考也不思考不足。团队正在邀请用户测试并反馈模型在具体任务上的思考表现，特别是过度或不足思考的案例。这反映了 Anthropic 对模型推理质量精细调优的重视，有助于提升用户体验。用户可以通过回复或直接联系团队成员来提供反馈。

AI 翻译 · 中文

Alex AlbertWe put a lot of work into calibrating thinking effort for Opus 4.8. As you're trying out the model, if you do run into any examples of it still over/under thinking, please flag it to us! kipply @kipperrii hello belov…

Claude05-28 16:57原文
Jerry Liu05-28 17:17原文
lmarena.ai05-28 17:30原文
AI SDK05-28 17:40原文
Lenny Rachitsky05-28 18:22原文
IT之家05-28 22:52原文
shao__meng05-29 00:55原文
OpenRouter05-28 17:09原文
Mike Krieger05-28 17:10原文
Perplexity05-28 17:24原文

查看原推