AITP
精选全部 AI 动态AI 日报Agent 接入关于更新日志信源提报反馈
登录 / 注册
AITOP
全部 AI 动态
AI 相关资讯全量信息流
全部博客资讯推文论文
全部模型产品行业论文技巧
标签:记忆设计×
6月16日
20:46
AITOP6月16日 20:46
600亿美元买下Cursor,xAI终于拿到了编程工具,但真正值得跟踪的或许不是AI600亿美元买下Cursor,xAI终于拿到了编程工具,但真正值得跟踪的或许不是AI
6月12日
12:57
AITOP6月12日 12:57
Claude代码里藏了个20260612,18个月后的AI记忆革命已经开始倒计时
6月11日
15:28
AITOP6月11日 15:28
1107 vs 303:谷歌悄悄开源了一个“拆打字机”的模型,把大模型速度翻了4倍
15:23
AITOP6月11日 15:23
DiffusionGemma颠覆文本生成?自回归模型的“统治”要结束了
15:07
AITOP6月11日 15:07
每秒1107个token,Google开源的扩散模型为什么能改变本地推理格局?
6月2日
12:04
12:04arXiv cs.AI@Yiheng Shu, Bernal Jiménez Gutiérrez, Saisri Padmaja Jonnalagedda, Yuguang Yao, Huan Sun, Yu Su
语言智能体在单个任务上花费大量推理时间,但跨任务的经验复用不足。现有基准难以严格评估持续学习,多聚焦长上下文检索或简单任务流,缺乏对跨任务关系的分析。本文提出AgentCL框架,通过受控任务流和迁移增益指标,评估智能体能否积累可复用经验、随时间改进并避免干扰。实验表明,受控流比简单流更能区分记忆设计的可塑性,而简单流和保留设置常暴露记忆导致的性能退化。该工作为设计平衡可塑性与稳定复用的记忆系统提供了方向。
论文持续学习智能体评估框架记忆设计语言模型

推荐理由:做智能体持续学习和记忆设计的团队,AgentCL提供了比现有基准更严格的评估方法,能帮你诊断记忆设计在跨任务复用中的真实效果,值得参考。
原文
精选全部日报登录