近期,微软在图像生成与编辑领域取得显著进展,其 MAI-Image 系列模型持续迭代。最初发布于 2025 年初的 MAI-Image-2 奠定了基础,而 2025 年 3 月推出的 MAI-Image-2.5 版本在图像编辑能力上实现重大突破。
- 核心进展包括:
- 图像编辑竞技场排名跃升:据 LMArena 披露,MAI-Image-2.5 在图像编辑竞技场中位列第二,仅落后于谷歌的 Nano Banana 2,且两者差距极小(微软MAI-Image-2.5登顶图像编辑竞技场第二,推进帕累托前沿)。该模型在单图编辑任务上表现突出,甚至超越此前领先的 Nano Banana 2 的某些版本(微软发布新模型,单图编辑能力超越Nano Banana 2)。
- 综合性能逼近顶级:在多项基准测试中,MAI-Image-2.5 基本追平谷歌 Nano Banana 2,尤其在文本渲染能力上提升显著,缩小了此前差距(微软 MAI-Image-2.5 追平谷歌 Nano Banana 2,文本渲染提升明显)。
- 微软整体 AI 布局:MAI-Image-2.5 的发布与微软首个自研推理模型 MAI-Thinking-1 及 Copilot 超级应用计划同期推出,显示微软正系统性地推进多模态和推理能力(微软发布首个自研推理模型 MAI-Thinking-1,Copilot 超级应用曝光)。
当前焦点在于图像编辑能力的竞争态势:MAI-Image-2.5 如何在保持高质量生成的同时,进一步优化编辑准确性和文本渲染细节。未来值得观察微软是否会将此模型整合到 Copilot 或设计工具中,以及 Nano Banana 2 是否会推出更强版本保持领先。