长短期记忆网络(LSTM)作为经典循环神经网络变体,近年来虽面临Transformer等架构的竞争,但在时序建模、序列生成等任务中仍展现独特价值。近期研究显示,LSTM在多个领域持续被采用或作为基线方法,同时其局限性也被深入探讨。
当前焦点在于如何根据任务特性选择或混合模型。LSTM在中小规模时序、低延迟场景中仍具优势,而Transformer在长序列和大数据上更突出。未来观察点包括:LSTM与注意力机制的更深层结合,以及其在边缘计算、医疗预测(如肿瘤耐药性预测,OncoTraj:首个EGFR突变NSCLC奥希替尼耐药纵向预测公开基准)等特定领域的优化应用。