12:00arXiv cs.LG@Yeganeh Marghi, Kelly Jin, Uygar Sümbül最优传输(OT)在分布映射中提供了理论框架,但计算成本高且结果难以解释。新提出的最优混合传输(OMT)将传输对象从单个样本转向子总体混合,并将问题转化为严格双凸优化,保证唯一全局最小值。OMT 在理论上证明传输映射的稳定性,即底层分布的有限扰动导致传输计划的有限变化。通过将子总体建模为指数族分布,OMT 的计算复杂度仅与混合成分数量相关,而非样本量。在图像数据和单细胞 RNA 测序等大规模真实数据集上,OMT 展示了有效性和实用性。论文最优传输混合模型双凸优化稳定性单细胞RNA测序推荐理由:OMT 解决了大规模数据上最优传输计算昂贵且结果难解释的痛点,做分布对齐、数据融合或生物信息学的团队可以直接用这个框架来获得稳定且可解释的传输计划。原文
11:14arXiv cs.LG@Michał Brzozowski, Neo Christopher Chung72°该论文质疑了Archetypal SAEs声称的稳定性优势。研究发现,其稳定性主要源于所有训练运行使用相同的确定性k-means解码器初始化,而非算法本身的约束。作者区分了“稳定性”(独立训练模型间的一致性)和“稳定化”(不同初始化向共同解收敛)两个概念,后者才是可解释性研究真正需要的。当移除共享初始化后,Archetypal约束并未带来额外的稳定化优势。此外,论文还指出预处理依赖的余弦几何问题会干扰终点稳定性指标的解读。研究建议,评估SAE稳定性时应包含轨迹诊断和初始化消融实验。论文稀疏自编码器可解释性稳定性初始化消融Archetypal SAEs推荐理由:这篇论文戳破了Archetypal SAEs稳定性神话,做可解释性研究的团队需要重新审视自己的评估方法——别被初始化技巧骗了,建议点开看轨迹诊断和消融实验怎么做。原文