扩散模型 · AI 话题观测

§ 01综述

扩散模型是一类基于逐步去噪过程生成高质量数据的生成模型，近年来在图像、音频、视频等领域取得显著进展，并持续向专业应用方向拓展。

扩散模型近期进展

LeVo 2：分层建模与渐进后训练实现稳定歌曲生成：提出分层架构和渐进后训练策略，使扩散模型能够生成结构完整、音质稳定的歌曲，标志着扩散模型在音乐生成领域的突破。原文链接

InfiniteDiffusion：学习式地形生成器被SIGGRAPH 2026录用：该工作展示了扩散模型在三维地形生成上的能力，仅需单卡RTX 3090 Ti即可生成逼真、连续的地形，被顶级图形学会议接收。原文链接

MDM-VGB：掩码扩散模型的推理时缩放与奖励引导生成：通过推理时缩放和奖励引导，提升掩码扩散模型的生成质量与可控性，为文本到图像等任务提供新思路。原文链接

Shell-LCC：数据流形隐式作为奖励模型用于文本到视频生成：利用数据流形的几何特性作为隐式奖励，引导扩散模型生成更符合文本描述的视频内容。原文链接

扩散模型正从通用图像生成向音乐、视频、三维内容等垂直领域深度扩展，同时理论研究（如传输映射估计的极限）也在推动其效率与可控性的提升。然而，实际应用中仍存在计算成本高、幻觉风险（如保险公司在灾难建模中遇到）等问题，如何在保持生成质量的同时降低推理开销、增强鲁棒性，是当前的主要挑战与研究方向。

§ 02相关报道10 条在档

§ 03邻近话题