论文72°

微软SkillOpt:将技能文档作为可训练外部状态,冻结Agent无需改动

Paper info here: https://t.co/OKHdAoGz46

精选理由

做AI Agent开发的团队常手工写技能文档但效果有限,SkillOpt用优化器自动迭代技能文件,零推理开销且效果显著,值得尝试。

AI 摘要

微软研究院提出SkillOpt方法,将Agent的技能文档视为可训练的外部状态,通过一个优化器模型对技能文件进行验证驱动的编辑(增、删、改指令),而Agent本身保持不变。实验显示,SkillOpt在52个(模型、基准、框架)组合中表现最佳或持平,在GPT-5.5上直接聊天提升23.5分,Codex提升24.8分,Claude Code提升19.1分,且优于人类编写的技能、TextGrad等方法。该方法不增加推理成本,学到的技能可跨模型和框架迁移。

AI 翻译 · 中文

微软研究院提出SkillOpt方法,将Agent的技能文档视为可训练的外部状态,通过一个优化器模型对技能文件进行验证驱动的编辑(增、删、改指令),而Agent本身保持不变。实验显示,SkillOpt在52个(模型、基准、框架)组合中表现最佳或持平,在GPT-5.5上直接聊天提升23.5分,Codex提升24.8分,Claude Code提升19.1分,且优于人类编写的技能、TextGrad等方法。该方法不增加推理成本,学到的技能可跨模型和框架迁移。

elvisPaper info here: x.com/omarsar0/statu… elvis @omarsar0 New research from Microsoft Research I see a lot of AI engineers handwriting agent skill docs and hope they generalize. Probably not optimal. This works show why. It