全部 AI 动态 · AI 热点

5月11日

22:16

22:16

AK@_akhaliq

MARBLE（Multi-Aspect Reward Balance for Diffusion RL）提出了一种新方法，旨在解决扩散模型强化学习中多个奖励信号之间的平衡问题。通过动态调整不同奖励方面的权重，该方法能在图像生成等任务中同时优化多个目标，如质量和多样性。论文展示了在多个基准测试上的改进效果，表明该方法能有效提升生成质量并减少模式崩溃。这对扩散模型的微调和可控生成具有实际意义。

论文扩散模型强化学习多目标优化图像生成

推荐理由：该方法直接回应了扩散模型RL中多目标优化的核心挑战，为提升生成质量和多样性提供了一种实用平衡策略。

22:16

22:16

AK@_akhaliq

该研究提出了一种连续时间分布匹配方法，用于改进扩散模型的蒸馏效率。传统扩散模型需要多步采样，而该方法通过优化连续时间分布匹配损失，实现了仅需几步即可生成高质量样本。实验表明，该方法在图像生成任务上显著加速推理，同时保持生成质量，对实时应用场景具有重要意义。论文提供了理论分析和实验结果。

论文扩散模型蒸馏图像生成推理加速

推荐理由：该方法为扩散模型加速推理提供了新思路，可能降低生成式AI的部署成本，值得关注后续应用拓展。

11:43

11:43arXiv cs.LG（学术论文）

PET-Adapter是一种针对PET图像重建的测试时域自适应框架，用于生成式PET重建模型。该框架仅需在体模数据上预训练，即可适配到不同解剖结构、示踪剂和扫描仪的临床数据集，无需配对真值。它通过逐层低秩解剖条件调制和基于有序子集期望最大化的热启动，将扩散步骤从50步减少到2步，显著提升计算效率。在多个临床数据集上的实验表明，该方法在全角度和有限角度设置下均实现了优越的3D重建性能，验证了其临床可行性和计算优势。

论文图像重建 PET-Adapter 测试时自适应扩散模型医学影像

推荐理由：该研究通过测试时自适应解决了深度学习PET重建模型的泛化困境，显著降低了计算成本，为临床实时部署提供了可行方案。

11:43

11:43arXiv cs.LG（学术论文）

字节级语言模型（BLT）虽匹配词元级模型性能，但逐字节自回归生成速度慢。本文提出三种加速方法：BLT Diffusion（BLT-D）用辅助扩散目标并行生成多个字节；BLT Self-speculation（BLT-S）通过推测解码扩展补丁边界并验证；BLT Diffusion+Verification（BLT-DV）结合扩散与自回归验证。所有方法在生成任务上估计内存带宽成本降低超50%，消除字节级模型实用化障碍。

论文字节级模型推理加速扩散模型推测解码无分词器

推荐理由：该工作直接解决字节级LLM的核心效率瓶颈，提出的混合推理策略（扩散+推测解码）为无分词器模型走向实际应用提供了可行路径。

11:42

11:42arXiv cs.LG（学术论文）

本研究提出 Normalizing Trajectory Models (NTM)，一种新型生成模型框架。传统扩散模型假设多步高斯去噪，在少步采样时失效；现有少步方法依赖蒸馏、一致性训练或对抗目标，但放弃了似然框架。NTM 将每个逆向步骤建模为条件标准化流，并用深层并行预测器连接整个轨迹。该模型可通过预训练流匹配模型初始化，利用精确轨迹似然进行自蒸馏，仅需四步即可生成高质量文本到图像样本。在基准测试中，NTM 在四步内匹配或超越了强基线模型，同时保留了可计算的似然。

论文标准化流扩散模型少步生成文本到图像似然训练

推荐理由：NTM 通过将标准化流与轨迹建模结合，在少步生成和无似然性能间取得平衡，为扩散模型加速提供了新思路。对需要快速推理且关注可解释性的应用（如实时图像生成）具有实际意义。