AI模型精选76°

Cohere 发布首个开源编程模型 North Mini Code,专为 Agent 编程设计

Cohere 发布首个开源编程模型「North Mini Code」 小参数、高效率、专做 Agent 编程 参数:MoE 架构(30B, 3B),128专家,每 token 激活 8 个 上下文:...

精选理由

Cohere 用 30B 参数实现了超越 120B 模型的 Agent 编程能力,做自动化代码修复和多步软件工程的开发者可以直接用起来,效率提升明显。

AI 摘要

Cohere 发布了其首个开源编程模型 North Mini Code,采用 MoE 架构(30B 参数,3B 激活),拥有 128 个专家,每 token 激活 8 个。模型支持 256K 输入和 64K 输出上下文,最低可在 1× H100(FP8)上运行。训练采用三阶段后训练方法,包括级联 SFT、可验证奖励强化学习(RLVR)和跨 Harness 泛化,使其在 Agent 编程任务上表现突出。在 SWE-Bench Verified 上 pass@10 达 80.2%,Terminal-Bench v2 pass@10 达 55.1%,并在同量级开源模型中领先。模型原生支持交错思考与工具调用,适合子 Agent 编排、代码审查、终端操作等场景。

AI 翻译 · 中文

Cohere 发布了其首个开源编程模型 North Mini Code,采用 MoE 架构(30B 参数,3B 激活),拥有 128 个专家,每 token 激活 8 个。模型支持 256K 输入和 64K 输出上下文,最低可在 1× H100(FP8)上运行。训练采用三阶段后训练方法,包括级联 SFT、可验证奖励强化学习(RLVR)和跨 Harness 泛化,使其在 Agent 编程任务上表现突出。在 SWE-Bench Verified 上 pass@10 达 80.2%,Terminal-Bench v2 pass@10 达 55.1%,并在同量级开源模型中领先。模型原生支持交错思考与工具调用,适合子 Agent 编排、代码审查、终端操作等场景。

shao__mengCohere 发布首个开源编程模型「North Mini Code」 小参数、高效率、专做 Agent 编程 参数:MoE 架构(30B, 3B),128专家,每 token 激活 8 个 上下文:256K 输入 / 64K 输出 最低硬件:1× H100(FP8) 官方发布 cohere.com/blog/north-min… HuggingFace huggingface.co/CohereLabs/Nor… # 训练方法(三阶段后