20:05rohanpaul_ai@rohanpaul_ai76°德克萨斯大学的一篇重要论文指出,AI 智能体在部署后会逐渐变得不可靠,即使底层模型本身没有变化。问题在于,智能体在持续运行中会总结旧对话、存储记忆、更新事实和执行维护,这些步骤中的每一个都可能悄悄“腐烂”,导致信息丢失、混淆或过时。例如,药物剂量可能被简化为“每日用药”,两个相似客户的信息可能混淆,已取消的订阅可能仍被视为有效。论文提出了 AgingBench 基准测试,用于评估智能体在多轮会话中的可靠性,并指出“给更多记忆”往往不是正确的修复方法。该研究将部署后的智能体重新定义为“老化的基础设施”,而非静态模型。论文智能体老化记忆管理AgingBench可靠性推荐理由:这篇论文戳中了 AI 智能体部署后的核心隐患——性能会随时间悄悄下降,做智能体运维或长期对话系统的团队值得细读,看完会重新审视记忆管理策略。原文