12:36arXiv cs.AI@Xuan Han, Yihao Zhao, Mingyu You精选Pose-ICL 是一种无需微调的框架,通过3D感知的上下文学习(ICL)实现姿态可控的主体定制。其核心机制 Surface-Anchored Position Embedding (SAPE) 将图像标记锚定到体积边界框的表面坐标,赋予模型显式的3D感知能力。该方法解决了现有2D模型在主体定制中姿态不准确和跨姿态外观不一致的问题。实验表明,Pose-ICL 在3D资产和真实主体上均显著优于现有方法,在姿态准确性和身份一致性上表现突出。该框架与现有DiT模型兼容,可直接应用。论文主体定制3D感知上下文学习姿态控制DiT推荐理由:做图像生成和主体定制的团队终于有了一个能精准控制姿态的方案——Pose-ICL 用3D感知解决了2D模型的老大难问题,做定制化生成的开发者可以直接试试。原文