百万上下文

§ 01综述

百万上下文指的是大语言模型能够一次性处理超过100万token（约75万个英文单词或150万个汉字）的上下文窗口，使模型在长文档分析、多轮对话、代码仓库理解等场景中保持信息连贯性。这一能力正成为前沿模型竞争的核心指标之一。

百万上下文近期进展

智谱GLM-5.2发布并开源：该模型不仅支持百万上下文，还引入了思考力度控制功能，允许用户调节推理深度，在长文本处理中平衡效率与质量。智谱 GLM-5.2 发布并开源，百万上下文与思考力度控制

MiniMax M3正式开源：作为原生多模态模型，M3支持百万上下文，并在编码与智能体任务中表现出顶尖水平，为开发者提供了灵活的长文本多模态处理方案。MiniMax M3 模型正式开源：原生多模态、百万上下文

昆仑万维SkyClaw-v1.0发布：该Agent模型专为百万上下文设计，可处理超长推理任务，扩展了智能体在复杂工作流中的应用边界。昆仑万维发布 SkyClaw-v1.0：百万上下文 Agent 模型

Qwen3.7-Max上线Model Studio：阿里云推出的推理智能体模型拥有百万token上下文窗口，并限时五折优惠，推动百万上下文能力平民化。Qwen3.7-Max 上线 Model Studio，百万上下文窗口限时五折

当前焦点与观察点

百万上下文的技术实现主要依赖改进的注意力机制（如线性注意力、稀疏注意力）和内存优化，但计算成本仍居高不下。当前焦点在于如何在保持长距离依赖的同时降低推理延迟。另一方面，应用层面开始涌现：法律合同全文审查、超长论文一次性分析、大型代码库重构等场景验证了其价值。争议点在于：多数实际任务是否需要百万规模上下文？部分观点认为较短的上下文结合检索增强（RAG）更经济有效。未来趋势是精准控制上下文长度与成本，以及多模态长上下文的融合。

§ 02相关报道07 条在档

§ 03邻近话题