Cohere 发布 Command A+:218B 稀疏 MoE 模型,两张 H100 即可运行

Cohere Releases Command A+: A 218B Sparse MoE Model for Agentic Workflows That Runs on as Few as Two H100 GPUs

精选理由

Cohere 把 218B 模型压到两张 H100 就能跑,做智能体工作流的团队终于有了高性价比的开源选择——多模态推理和 48 语言支持直接可用,建议试试。

AI 摘要

Cohere 发布了 Command A+,一个 218B 参数的稀疏混合专家(MoE)模型,整合了此前四个 Command A 变体。该模型在 W4A4 量化下仅需两张 H100 GPU 即可运行,支持 48 种语言,是 Cohere 首个多模态推理模型,专为智能体工作流设计。其开源特性降低了部署门槛,适合需要高效多模态推理和智能体任务的团队。

AI 翻译 · 中文

Cohere 发布了 Command A+,一个 218B 参数的稀疏混合专家(MoE)模型,整合了此前四个 Command A 变体。该模型在 W4A4 量化下仅需两张 H100 GPU 即可运行,支持 48 种语言,是 Cohere 首个多模态推理模型,专为智能体工作流设计。其开源特性降低了部署门槛,适合需要高效多模态推理和智能体任务的团队。

marktechpostCohere releases Command A+, an open-source 218B Sparse Mixture-of-Experts model consolidating four prior Command A variants into one. It runs on as few as two H100 GPUs at W4A4 quantization, supports 48 languages, and is