百万上下文·general

百万上下文

别名
首次出现
2026-05-22
最近出现
2026-06-17
累计提及
7
§ 01综述

百万上下文指的是大语言模型能够一次性处理超过100万token(约75万个英文单词或150万个汉字)的上下文窗口,使模型在长文档分析、多轮对话、代码仓库理解等场景中保持信息连贯性。这一能力正成为前沿模型竞争的核心指标之一。

百万上下文近期进展

  • 智谱GLM-5.2发布并开源:该模型不仅支持百万上下文,还引入了思考力度控制功能,允许用户调节推理深度,在长文本处理中平衡效率与质量。智谱 GLM-5.2 发布并开源,百万上下文与思考力度控制
  • MiniMax M3正式开源:作为原生多模态模型,M3支持百万上下文,并在编码与智能体任务中表现出顶尖水平,为开发者提供了灵活的长文本多模态处理方案。MiniMax M3 模型正式开源:原生多模态、百万上下文
  • 昆仑万维SkyClaw-v1.0发布:该Agent模型专为百万上下文设计,可处理超长推理任务,扩展了智能体在复杂工作流中的应用边界。昆仑万维发布 SkyClaw-v1.0:百万上下文 Agent 模型
  • Qwen3.7-Max上线Model Studio:阿里云推出的推理智能体模型拥有百万token上下文窗口,并限时五折优惠,推动百万上下文能力平民化。Qwen3.7-Max 上线 Model Studio,百万上下文窗口限时五折
  • 当前焦点与观察点

    百万上下文的技术实现主要依赖改进的注意力机制(如线性注意力、稀疏注意力)和内存优化,但计算成本仍居高不下。当前焦点在于如何在保持长距离依赖的同时降低推理延迟。另一方面,应用层面开始涌现:法律合同全文审查、超长论文一次性分析、大型代码库重构等场景验证了其价值。争议点在于:多数实际任务是否需要百万规模上下文?部分观点认为较短的上下文结合检索增强(RAG)更经济有效。未来趋势是精准控制上下文长度与成本,以及多模态长上下文的融合。

    § 02相关报道07 条在档
    1. 01
      智谱 GLM-5.2 发布并开源,百万上下文与思考力度控制
      歸藏(guizang.ai)
    2. 02
      MiniMax M3 模型正式开源:原生多模态、百万上下文
      IT之家
    3. 03
      MiniMax M3 发布:百万上下文、原生多模态,编码与智能体能力顶尖
      IT之家
    4. 04
      昆仑万维发布 SkyClaw-v1.0:百万上下文 Agent 模型
      IT之家
    5. 05
      努比亚星云AIOS 2.0机型无需更新系统即支持DeepSeek-V4
      IT之家
    6. 06
      Qwen3.7-Max 上线 Model Studio,百万上下文窗口限时五折
      阿里云 Alibaba Cloud
    7. 07
      Qwen 发布 Qwen3.7-Max:百万 token 上下文窗口的推理智能体模型
      marktechpost
    § 03邻近话题

    本页综述由 AITOP 基于公开报道整理。原报道版权归各自来源所有。

    /topic/%E7%99%BE%E4%B8%87%E4%B8%8A%E4%B8%8B%E6%96%87