近期AI领域围绕“自我”(Self)展开了一系列技术探索,核心趋势是让智能体和模型具备自我改进、自我反思、自我剪枝等能力,从而减少人工干预、提升自主性和效率。这些工作涉及智能体架构、注意力机制、模型优化等多个方向。
- 主要进展包括:
- 自我改进的智能体脚手架:Self-Harness框架通过反思和迭代,使智能体在无需人类反馈的情况下自主提升性能,相关实验显示其效果优于传统方法(Self-Harness:自我改进的智能体脚手架)。
- 自我反思的API设计:Self-Reflective APIs通过结构化建议机制,让AI Agent在出错后能自动修正,将任务恢复率提升了40个百分点,显著增强了可靠性(Self-Reflective APIs:结构化建议让AI Agent恢复率提升40个百分点)。
- 自剪枝注意力机制:Self-Pruned Key-Value Attention通过只保留对未来推理有用的记忆,降低了LLM的推理成本和显存占用,同时保持性能不降(Self-Pruned Key-Value Attention:让LLM只保留未来有用的记忆)。
- 自演化智能体:NVIDIA发布的Self-Evolving Hermes Agents能在企业场景中持续学习、适应环境变化,越用越智能,展示了自我改进在应用中的潜力(Self-Evolving Hermes Agents:越用越好的企业AI)。
- 递归自我改进框架:开源项目SIA(Self-Improving Agents)允许智能体自主优化自身模型权重,类似于“自我编程”,引发了关于安全与可控性的讨论(开源递归自我改进框架 SIA 发布,AI 智能体可自主优化模型权重)。
当前焦点在于:自我改进的边界在哪里?例如递归自我改进可能导致不可预测的行为,如何确保安全与对齐仍是难题。此外,自剪枝attention和自适应范数缩放(SAMN)等方法的实用性尚需大范围验证。未来观察点包括:自我改进是否会导致模型“自我膨胀”或遗忘原有能力;以及这些技术能否在主流框架中落地。