10:03arXiv cs.LG@Dmitrii GavrilevPianoKontext 是一种基于流匹配的古典钢琴音乐表现力渲染模型,能从无表情的 MIDI 乐谱生成时长可变、富有情感和节奏变化的演奏。它利用预训练的 Music2Latent 模型在潜在空间中操作,并通过动态时间规整(DTW)对齐乐谱与演奏数据,使 DiT 模块能有效学习两者间的依赖关系。该方法解决了传统音频编辑模型只能处理同步等长片段的局限,显著提升了对表现性时机的理解。实验表明,PianoKontext 能生成自然、富有表现力的钢琴演奏,音频示例已在项目页面公开。论文表现力渲染流匹配Music2Latent动态时间规整古典钢琴推荐理由:做音乐 AI 生成或钢琴演奏合成的开发者,终于有了一个能直接处理时长可变、表现力丰富的渲染方案——PianoKontext 用流匹配+潜在空间对齐解决了乐谱到演奏的时序难题,值得在古典钢琴数据集上试试。原文