微软SkillOpt：将技能文档作为可训练外部状态，冻结Agent无需改动

精选理由

做AI Agent开发的团队常手工写技能文档但效果有限，SkillOpt用优化器自动迭代技能文件，零推理开销且效果显著，值得尝试。

AI 摘要

微软研究院提出SkillOpt方法，将Agent的技能文档视为可训练的外部状态，通过一个优化器模型对技能文件进行验证驱动的编辑（增、删、改指令），而Agent本身保持不变。实验显示，SkillOpt在52个（模型、基准、框架）组合中表现最佳或持平，在GPT-5.5上直接聊天提升23.5分，Codex提升24.8分，Claude Code提升19.1分，且优于人类编写的技能、TextGrad等方法。该方法不增加推理成本，学到的技能可跨模型和框架迁移。

AI 翻译 · 中文

elvisPaper info here: x.com/omarsar0/statu… elvis @omarsar0 New research from Microsoft Research I see a lot of AI engineers handwriting agent skill docs and hope they generalize. Probably not optimal. This works show why. It…

查看原推