全部 AI 动态 · AI 热点

6月16日

20:46

AITOP6月16日 20:46

600亿美元买下Cursor，xAI终于拿到了编程工具，但真正值得跟踪的或许不是AI

6月12日

12:57

AITOP6月12日 12:57

Claude代码里藏了个20260612，18个月后的AI记忆革命已经开始倒计时

6月11日

15:28

AITOP6月11日 15:28

1107 vs 303：谷歌悄悄开源了一个“拆打字机”的模型，把大模型速度翻了4倍

15:23

AITOP6月11日 15:23

DiffusionGemma颠覆文本生成？自回归模型的“统治”要结束了

15:07

AITOP6月11日 15:07

每秒1107个token，Google开源的扩散模型为什么能改变本地推理格局？

5月25日

11:11

arXiv cs.AI@Yifan Yang, Ziyang Gong, Weiquan Huang, Qihao Yang, Ziwei Zhou, Zisu Huang, Yan Li, Xuemei Gao, Qi Dai, Bei Liu, Kai Qiu, Yuqing Yang, Dongdong Chen, Xue Yang, Chong Luo

精选72°

SkillOpt 提出了一种新方法，将智能体技能视为冻结模型的外部状态，通过独立的优化器模型对技能文档进行有界增删改编辑，并仅在严格提升验证集分数时接受修改。该方法引入了文本学习率预算、拒绝编辑缓冲区和逐轮慢/元更新机制，使技能训练稳定且部署时零额外模型调用。在 6 个基准、7 个目标模型和 3 种执行框架（直接对话、Codex、Claude Code）的 52 个测试单元中，SkillOpt 全部取得最佳或并列最佳，相比无技能基线在 GPT-5.5 上平均提升 19.1-24.8 个百分点。迁移实验表明，优化后的技能在不同模型规模、执行环境和相近数学基准间仍保持价值。

论文智能体技能优化文本空间优化 GPT-5.5 Codex

推荐理由：SkillOpt 解决了智能体技能无法像深度学习权重那样可靠优化的问题，做智能体开发或技能自动生成的团队可以直接用这套方法替代手工调参，效果显著且部署零开销。

原文