arXiv cs.LG@Mansoor Ahmed, Sujin Lee, Umar Khayaz, Murray Patterson精选37现有基于等变图神经网络(GNN)的抗体CDR设计方法虽然序列恢复率高,但存在严重的词汇坍塌问题,即过度预测少数氨基酸(如酪氨酸和甘氨酸),忽略功能重要的残基。EvoStruct通过交叉注意力适配器将冻结的蛋白质语言模型(PLM)与E(3)-等变GNN的3D结构上下文结合,并采用渐进式PLM解冻和R-Drop一致性正则化,专门解决CDR设计的词汇坍塌问题。在CHIMERA-Bench数据集上,EvoStruct相比最佳GNN基线,序列恢复率提升16%,困惑度降低43%,氨基酸多样性恢复提升2.3倍,且与真实结合对相关性最高。该方法为抗体设计提供了更准确、更多样化的序列生成能力。论文蛋白质设计抗体CDR等变图神经网络蛋白质语言模型词汇坍塌推荐理由:做抗体设计或蛋白质工程的团队,EvoStruct解决了GNN方法词汇坍塌的痛点,序列恢复和多样性双双提升,值得直接参考方法或复现实验。