01:12marktechpost@Sana Hassan精选本文介绍使用 GEPA 作为反思式提示进化框架,优化小型语言模型解决多步算术应用题的能力。从弱种子提示开始,构建确定性基准和结构化评估器,返回可操作反馈。多组件设置同时进化指令字段和输出格式规则。最后在保留验证集上比较基线和优化提示,检验泛化能力。该方法展示了如何通过结构化反馈和验证集提升提示质量。论文提示优化GEPA反思式框架结构化反馈多步推理推荐理由:做提示工程和模型微调的开发者,GEPA 框架提供了一种系统化的提示优化方法,比手动调参更高效,值得尝试。原文
10:23arXiv: Anthropic@Arquimedes Canedo, Grama Chethan精选当AI Agent调用API遇到验证错误时,传统做法返回自然语言错误描述,但Agent往往无法有效修复。该论文提出Self-Reflective API,在验证失败时返回机器可读的结构化恢复建议(recovery_feedback.suggestions[]),使Agent能直接修复请求并重试,无需外部推理。在30个样本、3个LLM、10个对抗任务的实验中,结构化建议在Anthropic模型上将任务完成率提升36.7-40个百分点,且每个成功token效率提升1.8-2.2倍。在gpt-4o-mini上效果不显著,但计费API的二次验证确认了模式。研究还发现了LLM基准测试中两类未记录的答案泄露问题,并开源了审计工具。论文AgentAPI设计错误恢复结构化反馈开源/仓库6 个信源在谈推荐理由:做Agent系统或API设计的开发者,这个方案直接解决了Agent调用API时频繁失败、需要人工介入的痛点——用结构化建议代替自然语言错误,让Agent自己就能修复重试,实测效果显著,建议直接参考其设计思路。原文