AITP
精选全部 AI 动态AI 日报Agent 接入关于更新日志信源提报反馈
登录 / 注册
AITOP
全部 AI 动态
AI 相关资讯全量信息流
全部博客资讯推文论文
全部模型产品行业论文技巧
标签:行为压缩×
6月19日
10:19
10:19arXiv cs.AI@Xijia Tao, Yihua Teng, Xinyu Fu, Ziru Liu, Kecheng Chen, Yuzhi Zhao, Suiyun Zhang, Rui Liu, Lingpeng Kong
SoftSkill 提出一种方法,将智能体的自然语言技能(Markdown 文件)转化为紧凑的连续上下文对象,通过可训练的软增量进行微调,而基础模型保持不变。在单轮设置下,Qwen3.5-4B 使用长度为 32 的 SoftSkill 前缀相比无技能提示,在 SearchQA 上提升 8.3 点,LiveMath 提升 42.1 点,DocVQA 提升 1.3 点。与 SkillOpt 相比,SoftSkill 在 SearchQA 上准确率提升 5.2 点,LiveMath 提升 12.5 点,同时将数百到数千个 Markdown 技能令牌替换为几个虚拟令牌。论文还探讨了智能体执行作为更难边界情况下的表现。
论文SoftSkillQwen3.5-4B智能体行为压缩上下文适应

推荐理由:论文提出了 SoftSkill,能把复杂技能压缩成几个虚拟向量,用 Qwen3.5-4B 测试,数学题直接涨了 42 个点,比 SkillOpt 还强。
原文
6月16日
20:46
AITOP6月16日 20:46
600亿美元买下Cursor,xAI终于拿到了编程工具,但真正值得跟踪的或许不是AI600亿美元买下Cursor,xAI终于拿到了编程工具,但真正值得跟踪的或许不是AI
6月12日
12:57
AITOP6月12日 12:57
Claude代码里藏了个20260612,18个月后的AI记忆革命已经开始倒计时
6月11日
15:28
AITOP6月11日 15:28
1107 vs 303:谷歌悄悄开源了一个“拆打字机”的模型,把大模型速度翻了4倍
15:23
AITOP6月11日 15:23
DiffusionGemma颠覆文本生成?自回归模型的“统治”要结束了
15:07
AITOP6月11日 15:07
每秒1107个token,Google开源的扩散模型为什么能改变本地推理格局?
精选全部日报登录