精选理由
这条观点戳中了 AI 编程中模型能力与工具使用的本质区别,做 AI 编程工具或评估模型的开发者看完会有感触——别再被 agentic coding 的噱头骗了。
一位开发者分享使用经验,认为模型的 one-pass 能力(在较少思考下一次性正确输出)才是衡量 SOTA 的关键。如果模型需要依赖 agentic coding 来修复第一次犯的错,反而说明其能力不足。真正的 agentic coding 应解决工程量和运行时问题,而非静态检查就能发现的 bug。作者调侃,若 bug 不在 thinking 中修复而要在后续上下文中修复,可能是为了推销 coding plan。
AI 翻译 · 中文
一位开发者分享使用经验,认为模型的 one-pass 能力(在较少思考下一次性正确输出)才是衡量 SOTA 的关键。如果模型需要依赖 agentic coding 来修复第一次犯的错,反而说明其能力不足。真正的 agentic coding 应解决工程量和运行时问题,而非静态检查就能发现的 bug。作者调侃,若 bug 不在 thinking 中修复而要在后续上下文中修复,可能是为了推销 coding plan。
我的使用经验是, one-pass 能力越强(且能在较少的思考下one-pass) 模型才是SOTA的. 要用 agentic coding 才能修复第一次犯的错反而是模型拉夸的表现, 再不济也要在Interleaved thinking过程中修复. agentic coding 是用来解决工程量和运行时问题的. 不是用来修静态检查就行发现的bug的.更简单的说, 你有bug不在thinking中修, 反而非要在n+1次上下文中修复, …