12:02arXiv cs.LG@Arthur Kosmala, Stephan Günnemann, Meng Gao, Brandon Wood分子动力学模拟因串行计算瓶颈难以提升单系统吞吐量。研究者提出 Langevin Speculative Dynamics (LSD),一种分布式、模型无关的推测采样方法,借鉴语言模型和扩散模型中的推测采样思路,用草稿模型快速生成模拟步骤,再通过目标模型并行验证,并引入传输映射保证分布一致性。LSD 将推测采样扩展到二阶 Langevin 动力学,理论上推导了加速比与物理参数的关系,实验显示在不同系统和模型组合下实现 3-9 倍加速,且采样轨迹与目标模型分布一致。该方法有望大幅提升分子模拟效率,对计算化学、材料科学等领域的研究者具有实用价值。论文分子动力学推测采样加速方法Langevin动力学分布式计算推荐理由:分子动力学模拟的串行瓶颈终于被打破——LSD 用推测采样实现 3-9 倍加速,做计算化学或材料模拟的团队可以直接尝试,无需修改现有模型。原文
13:26arXiv cs.LG@Kaiwen Shi, Carlos Oliver精选蛋白质结构分词器(PST)是蛋白质语言建模和功能预测的重要工具,但现有方法只捕捉静态结构的局部几何信息,忽略了蛋白质构象集合中的相关运动和替代状态。研究者提出 Ensembits,这是首个对蛋白质构象集合进行分词的方法,通过残差 VQ-VAE 和帧蒸馏目标在大型分子动力学语料上训练。Ensembits 在 RMSF 预测上优于所有相关方法,在基于 token 的方差分析测试中成为最强的独立结构分词器,并在 EC、GO、结合位点/亲和力预测以及零样本突变效应预测上匹配或超越静态分词器。蒸馏目标还允许从单个预测结构预测动态 token,缓解了动力学数据稀疏问题,为将动力学引入蛋白质语言建模和设计提供了离散词汇。论文蛋白质语言模型构象集合分词器分子动力学Ensembits推荐理由:做蛋白质结构预测和语言建模的团队终于有了能处理动态构象的工具——Ensembits 从单个结构就能预测运动模式,比静态分词器更贴近真实生物学,做功能预测和突变效应分析的可以直接用。原文