Self-Reflective APIs：结构化建议让AI Agent恢复率提升40个百分点

精选理由

做Agent系统或API设计的开发者，这个方案直接解决了Agent调用API时频繁失败、需要人工介入的痛点——用结构化建议代替自然语言错误，让Agent自己就能修复重试，实测效果显著，建议直接参考其设计思路。

AI 摘要

当AI Agent调用API遇到验证错误时，传统做法返回自然语言错误描述，但Agent往往无法有效修复。该论文提出Self-Reflective API，在验证失败时返回机器可读的结构化恢复建议（recovery_feedback.suggestions[]），使Agent能直接修复请求并重试，无需外部推理。在30个样本、3个LLM、10个对抗任务的实验中，结构化建议在Anthropic模型上将任务完成率提升36.7-40个百分点，且每个成功token效率提升1.8-2.2倍。在gpt-4o-mini上效果不显著，但计费API的二次验证确认了模式。研究还发现了LLM基准测试中两类未记录的答案泄露问题，并开源了审计工具。

AI 翻译 · 中文

arXiv: AnthropicWhen an AI agent calls an API and hits a validation error, it needs more than what went wrong -- it needs what to do next. A self-reflective API returns, on validation failure, a machine-readable recovery\_feedback.sugge…

IT之家06-02 18:46原文
Gary Marcus06-03 05:07原文
lmarena.ai06-04 16:06原文
宝玉06-04 19:24原文
cat06-04 22:15原文
shao__meng06-05 00:31原文

阅读原文