Anthropic工程师提示词维护实战：拆解与评估

精选理由

Anthropic工程师手把手教你维护生产提示词，从客服机器人到排班Agent，拆成小提示词更靠谱，还有评估妙招。

AI 摘要

Margot Van Laar在Code with Claude大会上分享提示词工程实战，核心观点是生产提示词调试维护比从零写更重要。她展示客服机器人场景：团队发现旧模型遗留的'禁止列表'指令导致新模型过度拟合，以及'请仔细计算'无效需提供计算器工具。在零售排班Agent场景中，她将复杂提示词拆成三个简单提示词（生成、评估、修复）组成循环，比单一大提示词更稳定。她强调可用Opus等更强推理模型加自适应思考来简化提示词，并务必建立量化评估基准验证改动效果。

AI 翻译 · 中文

berryxiaMargot Van Laar是Anthropic应用AI团队的工程师。她在Code with Claude大会上做了一场关于提示词工程实战的分享。核心观点只有一个：我们很少从零写提示词，大部分时间都在调试和维护已有的生产提示词。她用两个真实场景演示了这件事。第一个场景是客服机器人的维护。团队接手了一个已经在跑的提示词，第一步不是改内容，而是做结构化清理——用XML标签把角色、政策、语气、指南分开，移除冗余补丁，明确输出格式。…

MIT CSAIL06-27 16:01原文
小互06-28 13:12原文
shao__meng00:23原文
IT之家15:35原文
Decoder15:47原文
宝玉06-28 22:14原文
Jasper AI05:51原文
techcrunch18:10原文

查看原推