精选理由
想让你家 32B 模型在长任务上干翻 Claude 和 Gemini?试试 AutoMem——不动任务行为,只优化记忆管理,效果翻倍。
AutoMem 框架将 LLM 的记忆管理视为可训练技能,通过两轮优化自动改进。第一轮由强 LLM 审查完整轨迹并迭代修改记忆结构(提示、文件模式、动作词汇)。第二轮从多个回合中识别出好的记忆决策,作为训练信号直接提升模型记忆熟练度。在三个程序化生成的长周期游戏(Crafter、MiniHack、NetHack)中,仅优化记忆(不修改任务动作行为)使基础 32B 开放权重模型性能提升约 2-4 倍,达到与 Claude Opus 4.5 和 Gemini 3.1 Pro Thinking 等前沿系统竞争的水平。
AI 翻译 · 中文
AutoMem 框架将 LLM 的记忆管理视为可训练技能,通过两轮优化自动改进。第一轮由强 LLM 审查完整轨迹并迭代修改记忆结构(提示、文件模式、动作词汇)。第二轮从多个回合中识别出好的记忆决策,作为训练信号直接提升模型记忆熟练度。在三个程序化生成的长周期游戏(Crafter、MiniHack、NetHack)中,仅优化记忆(不修改任务动作行为)使基础 32B 开放权重模型性能提升约 2-4 倍,达到与 Claude Opus 4.5 和 Gemini 3.1 Pro Thinking 等前沿系统竞争的水平。
Memory expertise is a learned skill: knowing what to encode, when to retrieve, and how to organize knowledge--a capacity known in cognitive science as metamemory. We bring this perspective to LLMs by treating memory mana…
- elvis07-02 16:19原文