微软发布 MAI-Thinking-1 和 MAI-Code-1-Flash 模型

Microsoft's new MAI models

精选理由

微软用 35B 参数模型挑战 Sonnet 4.6,证明小模型也能出奇迹——做推理应用或 Copilot 开发的团队值得关注,尤其是对数据合规有要求的项目。

AI 摘要

微软今日发布两款新文本 LLM:MAI-Thinking-1(35B 参数,推理模型,面向早期合作伙伴)和 MAI-Code-1-Flash(5B 参数,专为 GitHub Copilot 和 VS Code 设计,已向个人用户推出)。MAI-Thinking-1 在盲测中优于 Sonnet 4.6,且参数规模较小,运行成本更低。两款模型均使用清洁、商业授权数据从头训练,未蒸馏第三方模型,也未使用未授权的网络数据。这标志着微软在低成本、合规数据训练的高效模型上迈出重要一步。

AI 翻译 · 中文

微软今日发布两款新文本 LLM:MAI-Thinking-1(35B 参数,推理模型,面向早期合作伙伴)和 MAI-Code-1-Flash(5B 参数,专为 GitHub Copilot 和 VS Code 设计,已向个人用户推出)。MAI-Thinking-1 在盲测中优于 Sonnet 4.6,且参数规模较小,运行成本更低。两款模型均使用清洁、商业授权数据从头训练,未蒸馏第三方模型,也未使用未授权的网络数据。这标志着微软在低成本、合规数据训练的高效模型上迈出重要一步。

Simon Willison’s WeblogMicrosoft announced two new text LLMs this morning - MAI-Thinking-1 (reasoning, 35B parameters, available to "select early partners") and MAI-Code-1-Flash (5B parameters, "purpose-built for GitHub Copilot and VS Code to