AI模型精选

DeepSeek发布DeepEP:开源MoE专家并行通信库

1,241

精选理由

DeepSeek开源了让MoE训练更快的通信库

AI 摘要

DeepSeek发布DeepEP,一个专为MoE模型设计的开源专家并行通信库。DeepEP利用NVLink实现高吞吐量、低延迟的全对全通信。该库同时支持训练和推理场景,优化了分布式MoE的效率。

图片来源 · DeepSeek: GitHub 新仓库
AI 翻译 · 中文

DeepSeek发布DeepEP,一个专为MoE模型设计的开源专家并行通信库。DeepEP利用NVLink实现高吞吐量、低延迟的全对全通信。该库同时支持训练和推理场景,优化了分布式MoE的效率。