图像编辑·general

图像编辑

别名
首次出现
2026-05-22
最近出现
2026-06-12
累计提及
16
§ 01综述

图像编辑领域近期迎来多项技术突破,竞争格局加速演变。微软发布的MAI-Image-2.5模型成为焦点,其在多项基准测试中表现亮眼:据OpenRouter报道,该模型在图像生成与编辑排行榜上登顶(OpenRouter),而lmarena.ai则指出其在图像编辑竞技场位列第二,仅次于GPT-Image-2(lmarena.ai)。此外,微软官方展示的模型自生成宣传图强调其照片级真实感(Microsoft AI),Paul Couvert评论其单图编辑能力已超越Nano Banana 2(Paul Couvert)。

与此同时,学术界与开源社区也在推动创新。arXiv上发布的ProductWebGen提出了多模态产品网页生成基准(arXiv),而MRT(Masked Region Transformer)则面向大规模分层图像生成与编辑(AK)。ETCHR工作尝试解耦图像编辑与理解以提升多模态推理(arXiv)。此外,Black Forest Labs发布的FLUX Erase实现了可控图像擦除(Justine Moore),进一步丰富了编辑工具生态。

当前焦点集中在模型性能排名与实用化能力上:微软MAI-Image-2.5虽已占据第二位置,但与GPT-Image-2的差距仍受关注;同时,多模态生成、分层编辑及精细控制方向的新方法不断涌现。未来观察点包括:头部模型是否会有新一轮迭代、开源方案能否进一步缩小与闭源模型的差距,以及图像编辑在多模态任务中的集成应用进展。

§ 02相关报道10 条在档
  1. 01
    微软MAI-Image-2.5发布:模型自生成宣传图,强照片级真实感
    Microsoft AI
  2. 02
    微软 MAI-Image-2.5 图像编辑排名第二,GPT-Image-2 仍居第一
    berryxia
  3. 03
    微软 MAI-Image-2.5 登顶图像生成与编辑排行榜
    OpenRouter
  4. 04
    微软MAI-Image-2.5登顶图像编辑竞技场第二,推进帕累托前沿
    lmarena.ai
  5. 05
    微软MAI-Image-2.5发布,登顶图像编辑竞技场第二
    lmarena.ai
  6. 06
    微软发布新模型,单图编辑能力超越Nano Banana 2
    Paul Couvert
  7. 07
    ProductWebGen:多模态产品网页生成基准测试
    arXiv cs.AI
  8. 08
    MRT:大规模分层图像生成与编辑的掩码区域Transformer
    AK
  9. 09
    ETCHR:解耦图像编辑与理解,提升多模态推理能力
    arXiv cs.AI
  10. 10
    Black Forest Labs 发布 FLUX Erase:可控图像擦除
    Justine Moore
§ 03邻近话题

本页综述由 AITOP 基于公开报道整理。原报道版权归各自来源所有。

/topic/%E5%9B%BE%E5%83%8F%E7%BC%96%E8%BE%91