精选理由
MiniMax 的 M2 论文展示了模型开始参与自身开发闭环,做 AI 训练和模型优化的团队值得关注——自我进化能力可能改变模型迭代方式。
MiniMax 在 X 平台预告即将推出 M3 系列 AI 模型,并转发了一篇关于 M2 系列的 arxiv 论文。M2 系列总参数 229.9B,但每个词元仅激活 9.8B 参数,主打低激活高智能,配备 192K 上下文窗口。论文重点介绍了 M2.7 的自我进化雏形:模型能自主排查训练失败、阅读日志、修改代码,并在内部任务上完成 100 轮自主迭代,吸收团队 30%-50% 的日常迭代工作量。此外,MiniMax 还提出了面向智能体的强化学习系统 Forge,支持白盒与黑盒智能体统一接入,降低长轨迹训练成本。这些进展表明 MiniMax 在高效模型架构和模型自主迭代方面取得重要突破。
AI 翻译 · 中文
MiniMax 在 X 平台预告即将推出 M3 系列 AI 模型,并转发了一篇关于 M2 系列的 arxiv 论文。M2 系列总参数 229.9B,但每个词元仅激活 9.8B 参数,主打低激活高智能,配备 192K 上下文窗口。论文重点介绍了 M2.7 的自我进化雏形:模型能自主排查训练失败、阅读日志、修改代码,并在内部任务上完成 100 轮自主迭代,吸收团队 30%-50% 的日常迭代工作量。此外,MiniMax 还提出了面向智能体的强化学习系统 Forge,支持白盒与黑盒智能体统一接入,降低长轨迹训练成本。这些进展表明 MiniMax 在高效模型架构和模型自主迭代方面取得重要突破。
IT之家 5 月 27 日消息,上海稀宇科技有限公司(MiniMax)今天在 X 平台发布推文, 预告将推出 MiniMax M3 系列模型。 该推文转发了一篇 5 月 26 日发表在 arxiv 上的论文《The MiniMax-M2 Series: Mini Activations Unleashing Max Real-World Intelligence》,回顾了 MiniMax M2.x 系列模型的背后工作。IT之家附上相关截…