AutoMem：将记忆管理作为可训练技能自动化学习

精选理由

想让你家 32B 模型在长任务上干翻 Claude 和 Gemini？试试 AutoMem——不动任务行为，只优化记忆管理，效果翻倍。

AI 摘要

AutoMem 框架将 LLM 的记忆管理视为可训练技能，通过两轮优化自动改进。第一轮由强 LLM 审查完整轨迹并迭代修改记忆结构（提示、文件模式、动作词汇）。第二轮从多个回合中识别出好的记忆决策，作为训练信号直接提升模型记忆熟练度。在三个程序化生成的长周期游戏（Crafter、MiniHack、NetHack）中，仅优化记忆（不修改任务动作行为）使基础 32B 开放权重模型性能提升约 2-4 倍，达到与 Claude Opus 4.5 和 Gemini 3.1 Pro Thinking 等前沿系统竞争的水平。

AI 翻译 · 中文

arXiv cs.AIMemory expertise is a learned skill: knowing what to encode, when to retrieve, and how to organize knowledge--a capacity known in cognitive science as metamemory. We bring this perspective to LLMs by treating memory mana…

elvis07-02 16:19原文

阅读原文