23:47AWS Machine Learning Blog@Madhu Parthasarathy精选71°Amazon Bedrock AgentCore新增多项能力,支持连接组织、网页和付费知识源,扩展智能体的知识范围。新工具帮助团队在生产环境中定位和修复问题,并实施随智能体能力提升自动扩展的控制机制。这些功能使开发者能更快构建更强大的智能体,并以规模化方式治理和持续改进。AI产品Amazon BedrockAgentCore智能体知识源持续学习1 个信源在谈推荐理由:AWS刚更新了Bedrock AgentCore,现在能连更多知识源,还加了监控和自动控制,做智能体更省心了。原文
10:19marktechpost@Michal Sutter精选72°Trajectory 与 UC Berkeley Sky Lab 和 Anyscale 合作,构建了一个用于持续学习的并发多 LoRA 训练栈。该方案将每个强化学习实验映射到始终热运行的引擎上的专用 LoRA 适配器,相比单租户基线实现了 2.81 倍的端到端实验吞吐量提升,且无奖励回归。代码已在 NovaSky-AI/SkyRL 开源。这一进展解决了持续学习中多实验并行效率低下的问题,对强化学习研究和工程团队有直接价值。AI模型LoRA持续学习强化学习开源/仓库训练栈推荐理由:做强化学习持续训练的团队终于有了高效的并行方案——2.81 倍吞吐量提升且不损失奖励,直接开源可用,建议试试。原文
13:33marktechpost@Asif Razzaq精选来自新加坡国立大学、MIT和A*STAR的研究人员提出了MEMO框架,该框架将语料库知识编码到一个独立的可训练记忆模型中,无需修改大语言模型(LLM)的参数。MEMO通过模块化设计,让LLM能够动态访问外部记忆,从而高效学习新知识,同时保持原有模型能力不变。这一方法解决了LLM在持续学习中的灾难性遗忘问题,并降低了更新成本。实验表明,MEMO在知识注入任务上表现优异,且不影响模型原有性能。论文记忆模型模块化框架持续学习LLM知识注入推荐理由:MEMO解决了LLM持续学习中的核心痛点——无需重训模型就能注入新知识,做知识密集型应用(如问答、检索增强生成)的团队可以直接参考,值得关注。原文