JetBrains 发布 Mellum2：12B MoE 模型，专为多模型 AI 流水线中的快速专用任务设计

精选理由

JetBrains 把 MoE 模型塞进开发者工具链，做 IDE 插件或代码分析工具的团队可以直接用 Mellum2 替换通用模型，提升响应速度且不牺牲质量。

AI 摘要

JetBrains 发布了 Mellum2，一个 12B 参数的混合专家（MoE）模型，基于 Apache 2.0 开源协议。该模型在 10.6 万亿 token 上训练，专为多模型 AI 流水线中的快速专用任务优化，如代码补全、重构建议等。Mellum2 旨在平衡性能与效率，适合集成到开发工具中，提升开发者体验。其 MoE 架构使其在保持较小激活参数的同时，实现高精度输出。

JetBrains 发布 Mellum2：12B MoE 模型，专为多模型 AI 流水线中的快速专用任务设计 — 图片来源 · marktechpost

AI 翻译 · 中文

marktechpostJetBrains releases Mellum2 under Apache 2.0 — a 12B MoE model trained on 10.6 trillion tokens for AI workflows. The post JetBrains Releases Mellum2: A 12B MoE Model for Fast, Specialized Tasks in Multi-Model AI Pipelines…

阅读原文