Claude Opus 4.8 上线:编程更可靠,减少无依据结论

Claude Opus 4.8 上线:提升 AI 编程可靠性,减少无依据结论

精选理由

做 AI 编程和智能体开发的团队终于有了更可靠的模型——Opus 4.8 减少无依据结论,主动标出不确定性,建议在复杂多步骤任务中直接试用。

AI 摘要

Anthropic 于 5 月 29 日发布旗舰模型 Claude Opus 4.8,重点提升编程、智能体和知识工作能力。相比 Opus 4.7,新模型在复杂任务中更稳定,能主动提问、识别错误,并减少无依据结论。官方评估显示,其放任代码缺陷的概率降低约 4 倍,同时亲社会行为指标创新高。claude.ai 新增 effort 程度控制,用户可平衡质量与响应速度。定价不变,快速模式速度提升 2.5 倍,成本降至 1/3。

AI 翻译 · 中文

Anthropic 于 5 月 29 日发布旗舰模型 Claude Opus 4.8,重点提升编程、智能体和知识工作能力。相比 Opus 4.7,新模型在复杂任务中更稳定,能主动提问、识别错误,并减少无依据结论。官方评估显示,其放任代码缺陷的概率降低约 4 倍,同时亲社会行为指标创新高。claude.ai 新增 effort 程度控制,用户可平衡质量与响应速度。定价不变,快速模式速度提升 2.5 倍,成本降至 1/3。

IT之家IT之家 5 月 29 日消息,Anthropic 今天(5 月 29 日)宣布推出旗舰新模型 Claude Opus 4.8, 主打更强的智能体编程、多领域推理和知识工作能力。 官方表示,相比较 Opus 4.7 模型,本次 Opus 4.8 更新幅度较小,在保持价格不变的情况下,主要提升编程、智能体、推理和知识工作等用户能感知的方面。 能力层面,官方援引多家早期测试方反馈称,表示 Opus 4.8 “更可靠,判断也更敏锐”,在复杂多