DeepSeek-V4

§ 01综述

DeepSeek-V4是深度求索公司研发的下一代大语言模型，当前处于发布前的优化阶段，预计2025年7月中旬进入通用可用阶段。该模型在架构和推理效率上持续迭代，近期多项开源技术及部署优化成果进一步提升了其竞争力。

DeepSeek-V4近期进展

发布时间明确：据相关推文，DeepSeek V4 预计 7 月中旬进入通用可用阶段，标志着该模型即将面向公众开放。 DeepSeek v4 预计 7 月中旬进入通用可用阶段

推理加速框架开源：DeepSeek 开源了 DSpark 投机解码框架，针对 V4 模型可将每用户生成速度提升60-85%，显著降低推理延迟。 DeepSeek开源DSpark投机解码框架，推理提速60-85%

低成本应用案例：开发者基于 DeepSeek V4 构建终端编码 agent，修复7个bug仅花费1.07美元，展示了其在代码生成领域的成本效益。基于DeepSeek V4的终端编码agent，7个bug修复仅¥1.07

部署性能优化：SGLang 团队在 GB300 硬件上部署 DeepSeek-V4，实现了5倍吞吐量提升，说明其推理系统可扩展性强。 SGLang在GB300部署DeepSeek-V4：5倍吞吐量提升

当前焦点与观察点

当前围绕 DeepSeek-V4 的焦点集中于推理效率与成本平衡。DSpark 等开源框架直接解决了大模型部署时的生成速度瓶颈，而实际应用案例则验证了其性价比。同时，市场竞争加剧——GLM-5.2 在 OpenRouter 上的 token 份额快速追赶 DeepSeek V4，且在国内模型投票中以79.7%领先。这表明 V4 虽在性能上具有优势，但需持续优化以应对竞品的差异化体验。此外，学术层面已有针对 V4 的 MHC 对齐块推测解码研究（如 HyperDFlash），进一步拓展了其技术边界。整体上，DeepSeek-V4 正从技术验证走向规模化落地，生态构建与速度优化将是其下一阶段的关键挑战。

§ 02相关报道10 条在档

§ 03邻近话题