22:16AK@_akhaliqMARBLE(Multi-Aspect Reward Balance for Diffusion RL)提出了一种新方法,旨在解决扩散模型强化学习中多个奖励信号之间的平衡问题。通过动态调整不同奖励方面的权重,该方法能在图像生成等任务中同时优化多个目标,如质量和多样性。论文展示了在多个基准测试上的改进效果,表明该方法能有效提升生成质量并减少模式崩溃。这对扩散模型的微调和可控生成具有实际意义。论文扩散模型强化学习多目标优化图像生成推荐理由:该方法直接回应了扩散模型RL中多目标优化的核心挑战,为提升生成质量和多样性提供了一种实用平衡策略。原文
22:16AK@_akhaliq该研究提出了一种连续时间分布匹配方法,用于改进扩散模型的蒸馏效率。传统扩散模型需要多步采样,而该方法通过优化连续时间分布匹配损失,实现了仅需几步即可生成高质量样本。实验表明,该方法在图像生成任务上显著加速推理,同时保持生成质量,对实时应用场景具有重要意义。论文提供了理论分析和实验结果。论文扩散模型蒸馏图像生成推理加速推荐理由:该方法为扩散模型加速推理提供了新思路,可能降低生成式AI的部署成本,值得关注后续应用拓展。原文
11:43arXiv cs.LG(学术论文)PET-Adapter是一种针对PET图像重建的测试时域自适应框架,用于生成式PET重建模型。该框架仅需在体模数据上预训练,即可适配到不同解剖结构、示踪剂和扫描仪的临床数据集,无需配对真值。它通过逐层低秩解剖条件调制和基于有序子集期望最大化的热启动,将扩散步骤从50步减少到2步,显著提升计算效率。在多个临床数据集上的实验表明,该方法在全角度和有限角度设置下均实现了优越的3D重建性能,验证了其临床可行性和计算优势。论文图像重建PET-Adapter测试时自适应扩散模型医学影像推荐理由:该研究通过测试时自适应解决了深度学习PET重建模型的泛化困境,显著降低了计算成本,为临床实时部署提供了可行方案。原文
11:43arXiv cs.LG(学术论文)字节级语言模型(BLT)虽匹配词元级模型性能,但逐字节自回归生成速度慢。本文提出三种加速方法:BLT Diffusion(BLT-D)用辅助扩散目标并行生成多个字节;BLT Self-speculation(BLT-S)通过推测解码扩展补丁边界并验证;BLT Diffusion+Verification(BLT-DV)结合扩散与自回归验证。所有方法在生成任务上估计内存带宽成本降低超50%,消除字节级模型实用化障碍。论文字节级模型推理加速扩散模型推测解码无分词器推荐理由:该工作直接解决字节级LLM的核心效率瓶颈,提出的混合推理策略(扩散+推测解码)为无分词器模型走向实际应用提供了可行路径。原文
11:42arXiv cs.LG(学术论文)本研究提出 Normalizing Trajectory Models (NTM),一种新型生成模型框架。传统扩散模型假设多步高斯去噪,在少步采样时失效;现有少步方法依赖蒸馏、一致性训练或对抗目标,但放弃了似然框架。NTM 将每个逆向步骤建模为条件标准化流,并用深层并行预测器连接整个轨迹。该模型可通过预训练流匹配模型初始化,利用精确轨迹似然进行自蒸馏,仅需四步即可生成高质量文本到图像样本。在基准测试中,NTM 在四步内匹配或超越了强基线模型,同时保留了可计算的似然。论文标准化流扩散模型少步生成文本到图像似然训练推荐理由:NTM 通过将标准化流与轨迹建模结合,在少步生成和无似然性能间取得平衡,为扩散模型加速提供了新思路。对需要快速推理且关注可解释性的应用(如实时图像生成)具有实际意义。原文