上下文管理

§ 01综述

上下文管理正成为AI Agent落地的关键瓶颈，近期业界从工具、模型、系统三个层面密集推动方案落地，核心矛盾在于“长上下文效率”与“结构化可控”之间的平衡。

主要进展

显式上下文文件标准化：Claude Design支持CLAUDE.md文件，允许开发者像“反复叮嘱”一样初始化并持久化行为约束（Claude Design 支持 CLAUDE.md 文件）。LangChain同步推出Context Hub与Deep Agents v0.6，实现上下文文件的版本化与后端管理（LangChain 推出 Context Hub、Deep Agents v0.6 发布）。

高效压缩与选择性记忆：Claude Code引入60%上下文压缩规则，直接压缩历史以减少Token消耗（Claude Code 的 60% 上下文压缩规则）。AdaCoM则用小模型动态管理Agent上下文，在长任务中提升39%性能（AdaCoM：用小模型管理上下文）。

部署感知的Token优化：新论文《The Efficiency Frontier》提出部署感知策略，在保持性能前提下节省25%以上的Token（The Efficiency Frontier），强调根据实际硬件与延迟约束自适应选择上下文长度。

当前焦点：业界共识是上下文管理不能依赖单一方案——文件式提示为开发者提供显式控制，压缩与选择性记忆解决长窗口成本，而部署感知优化则让模型在资源受限场景更实用。争议点在于压缩是否必然丢失关键信息、显式文件是否会增加人类书写负担。

未来观察点：上下文管理是否会从手工提示走向自动化、由小模型持续调度的混合架构；以及不同Agent间共享上下文演进的标准是否会出现。

§ 02相关报道10 条在档

§ 03邻近话题