全部 AI 动态 · AI 热点

6月19日

10:19

10:19

arXiv cs.AI@Xijia Tao, Yihua Teng, Xinyu Fu, Ziru Liu, Kecheng Chen, Yuzhi Zhao, Suiyun Zhang, Rui Liu, Lingpeng Kong

SoftSkill 提出一种方法，将智能体的自然语言技能（Markdown 文件）转化为紧凑的连续上下文对象，通过可训练的软增量进行微调，而基础模型保持不变。在单轮设置下，Qwen3.5-4B 使用长度为 32 的 SoftSkill 前缀相比无技能提示，在 SearchQA 上提升 8.3 点，LiveMath 提升 42.1 点，DocVQA 提升 1.3 点。与 SkillOpt 相比，SoftSkill 在 SearchQA 上准确率提升 5.2 点，LiveMath 提升 12.5 点，同时将数百到数千个 Markdown 技能令牌替换为几个虚拟令牌。论文还探讨了智能体执行作为更难边界情况下的表现。

论文 SoftSkill Qwen3.5-4B 智能体行为压缩上下文适应

推荐理由：论文提出了 SoftSkill，能把复杂技能压缩成几个虚拟向量，用 Qwen3.5-4B 测试，数学题直接涨了 42 个点，比 SkillOpt 还强。

6月16日

20:46

AITOP6月16日 20:46

600亿美元买下Cursor，xAI终于拿到了编程工具，但真正值得跟踪的或许不是AI

600亿美元买下Cursor，xAI终于拿到了编程工具，但真正值得跟踪的或许不是AI

6月12日

12:57

AITOP6月12日 12:57

Claude代码里藏了个20260612，18个月后的AI记忆革命已经开始倒计时

6月11日

15:28

AITOP6月11日 15:28

1107 vs 303：谷歌悄悄开源了一个“拆打字机”的模型，把大模型速度翻了4倍

15:23

AITOP6月11日 15:23

DiffusionGemma颠覆文本生成？自回归模型的“统治”要结束了

15:07

AITOP6月11日 15:07

每秒1107个token，Google开源的扩散模型为什么能改变本地推理格局？