DeepSeek-V4 是深度求索于 2026 年 5 月发布的下一代大语言模型系列,以 1M 超长上下文和全开源策略迅速成为行业焦点。该系列包含多个变体,并在生态适配、推理效率、第三方集成等方面取得了关键进展,同时也引发了关于模型能力上限与商业化落地的讨论。
- 近期主要进展:
- 官方发布与开源:DeepSeek-V4 Preview 正式发布并开源,支持 1M 上下文长度,刷新了长文本处理能力上限(DeepSeek-V4 Preview 正式发布并开源,支持 1M 上下文)。
- 硬件与框架适配:完成对华为昇腾芯片的全面适配,标志着中国 AI 软件栈的重要里程碑(DeepSeek V4 完成华为昇腾全面适配,中国 AI 栈里程碑);同时有开源框架 OrbIt 实现单节点即可训练万亿参数模型(Orbit 开源框架:单节点训练万亿参数模型,DeepSeek-V4 可用)。
- 生态与工具链扩展:NVIDIA 发布修复版 DeepSeek-V4-Pro-NVFP4(NVIDIA 发布 DeepSeek-V4-Pro-NVFP4 修复版);努比亚星云AIOS 2.0 原生集成该模型(努比亚星云AIOS 2.0机型无需更新系统即支持DeepSeek-V4);SiliconFlow 内置预设支持 DeepSeek V4(CC Switch 统一管理多 CLI,SiliconFlow 内置预设支持 DeepSeek V4 等)。
- 学术与领域应用:arXiv 上的研究展示了利用 DeepSeek-V4 进行上下文工具数据蒸馏以生成 Kubernetes Manifest(上下文工具数据蒸馏:Kubernetes Manifest 生成方法),体现了其在 DevOps 等垂直领域的应用潜力。
当前焦点已从单纯的参数规模竞赛转向实际部署成本、长上下文质量以及跨平台兼容性。未来需观察 DeepSeek-V4 在更多企业级场景中的表现,以及与其他开源模型(如 Gemma 4、Kimi K2.6)的竞争态势。