提示词工程实战：评估比改提示更重要

精选理由

Anthropic工程师手把手教你怎么调客服提示词和搭Agent，用Opus加循环拆解比堆复杂指令更管用，核心就一句话：先搞评估

AI 摘要

Anthropic工程师Margot Van Laar在Code with Claude分享提示词工程最佳实践，强调通过评估（Eval）而非直接修改提示词来优化。她用客服机器人和零售排班两个案例演示：使用XML标签结构化提示词、移除旧模型遗留的禁止列表（如Claude 3 Opus）、用工具替代指令处理计算任务。拆解复杂任务为生成-评估-修复循环，并建议用更强推理模型（如Opus）加自适应思考替代小模型复杂提示词。

AI 翻译 · 中文

berryxia睡前来一发，这个视频还是挺完美的。 Anthropic的应用AI工程师Margot Van Laar在Code with Claude分享了提示词工程的实战手册。核心观点是：我们很少从零写提示词，大部分时间都在调试和维护已有的生产提示词。最好的起点永远是评估（Eval），而不是直接改提示词。她用两个真实场景演示了最佳实践： 1. 维护已有提示词**（客服机器人） - 先做通用清理：用XML标签结构化（角色/政策/语气/指南分…

MIT CSAIL06-27 16:01原文
小互06-28 13:12原文
shao__meng00:23原文
IT之家15:35原文
Decoder15:47原文
宝玉06-28 22:14原文
Jasper AI05:51原文
techcrunch18:10原文

查看原推