17:51IT之家(博客/媒体)科大讯飞在2026长三角机器人及自动化展览会上发布星火多模态大模型 X2-VL,这是当前唯一基于全国产算力训练的主流大模型,采用专属 MoE 架构。该模型基于无锡本地算力平台太湖星跃平台加速训练。在高中各科图文试题测试中,X2-VL 答题准确率接近95%。在挑战2026年高考数学全国I卷中,X2-VL 获得148分,超过模型A(144分)和模型B(143分)。AI模型星火X2-VL科大讯飞多模态国产算力MoE架构推荐理由:国产算力训练的模型,高考数学148分原文
10:58shao__meng@shao__meng精选76°Cohere 发布了其首个开源编程模型 North Mini Code,采用 MoE 架构(30B 参数,3B 激活),拥有 128 个专家,每 token 激活 8 个。模型支持 256K 输入和 64K 输出上下文,最低可在 1× H100(FP8)上运行。训练采用三阶段后训练方法,包括级联 SFT、可验证奖励强化学习(RLVR)和跨 Harness 泛化,使其在 Agent 编程任务上表现突出。在 SWE-Bench Verified 上 pass@10 达 80.2%,Terminal-Bench v2 pass@10 达 55.1%,并在同量级开源模型中领先。模型原生支持交错思考与工具调用,适合子 Agent 编排、代码审查、终端操作等场景。AI模型开源模型编程模型Agent编程MoE架构Cohere6 个信源在谈推荐理由:Cohere 用 30B 参数实现了超越 120B 模型的 Agent 编程能力,做自动化代码修复和多步软件工程的开发者可以直接用起来,效率提升明显。原文