128k·general

128k

别名
首次出现
2026-05-29
最近出现
2026-06-10
累计提及
8
§ 01综述

近期,围绕“128k”这一上下文长度关键词,AI 领域在降低推理成本与提升解码效率方面取得多项突破。背景上,长上下文(如128k token)虽能提升模型理解能力,但推理时显存占用高、解码速度慢,成为落地瓶颈。

当前焦点在于稀疏注意力与MoE的组合能否进一步降低128k长度下的推理能耗,同时保持模型准确性。未来观察点包括这些技术在实时语音交互(如GPT Realtime 2.0催生的应用)中的实际表现,以及跨层稀疏注意力对不同长度上下文的泛化能力。

§ 02相关报道05 条在档
  1. 01
    腾讯混元提出 Stem 稀疏注意力算法,首字延迟降低 3.6 倍
    IT之家
  2. 02
    CLSA:跨层稀疏注意力实现7.6倍解码加速
    arXiv cs.AI
  3. 03
    GPT Realtime 2.0 催生 17 个创业点子,实时语音交互新范式
    AI Will
  4. 04
    Liquid AI LFM2.5-8B-A1B:1.5B活跃参数跑本地Agent,接近4倍参数模型
    berryxia
  5. 05
    Liquid AI 发布 LFM2.5-8B-A1B:端侧 MoE 模型,8.3B 参数仅激活 1.5B
    marktechpost
§ 03邻近话题

本页综述由 AITOP 基于公开报道整理。原报道版权归各自来源所有。

/topic/128k