AITP
精选全部 AI 动态AI 日报Agent 接入关于更新日志信源提报反馈
登录 / 注册
AITOP
全部 AI 动态
AI 相关资讯全量信息流
全部博客资讯推文论文
全部模型产品行业论文技巧
标签:LSTM×
6月18日
09:45
09:45arXiv cs.AI@David Aaron Evans, Jay C. Rothenberger, Kara J. Sulia, Nick P. Bassill, Chris D. Thorncroft
HRRR高分辨率数值天气预报系统的误差常与未解析的边界层过程、对流和地形诱导环流有关。已有研究用LSTM网络基于地表观测预测HRRR误差,但复杂垂直大气演变时性能下降。本文提出LSTM-ViT混合框架,融合地表序列学习与纽约州网大气廓线数据。在预测降水、10m风速和2m温度误差上,LSTM-ViT均优于基线LSTM,其中降水误差预测技能提升约两倍。改进在短预报时效和行星边界层活跃期尤为显著。
论文LSTMVision TransformerHRRR天气预报预报误差

推荐理由:这篇论文用LSTM加Vision Transformer看大气垂直结构,让天气预报误差预测精度翻倍,搞气象AI的值得一读。
原文
6月16日
20:46
AITOP6月16日 20:46
600亿美元买下Cursor,xAI终于拿到了编程工具,但真正值得跟踪的或许不是AI600亿美元买下Cursor,xAI终于拿到了编程工具,但真正值得跟踪的或许不是AI
6月12日
13:44
13:44arXiv cs.LG@Mohammed Bouri, Mohammed Erradi, Adnane Saoud
自然语言处理模型易受词替换攻击,现有防御主要关注一阶敏感性(梯度),但忽略了曲率(梯度变化率)的影响。本文提出S-GBT(平滑增长界张量),一种二阶方法,通过逐元素约束Hessian矩阵并加入正则化项,在训练中最小化这些界,从而获得更紧的认证鲁棒性。该方法适用于LSTM和CNN架构,在多个基准数据集上,结合一阶和二阶正则化使认证鲁棒准确率提升高达23.4%,同时保持干净准确率竞争力。研究表明,同时控制梯度及其变化是构建更鲁棒模型的有前景方向。
论文词替换攻击认证鲁棒性二阶优化LSTMCNN

推荐理由:NLP安全研究者终于有了兼顾梯度与曲率的防御方法——S-GBT在词替换攻击下将认证鲁棒准确率提升23.4%,做文本对抗防御的团队值得关注。
原文
12:57
AITOP6月12日 12:57
Claude代码里藏了个20260612,18个月后的AI记忆革命已经开始倒计时
6月11日
15:28
AITOP6月11日 15:28
1107 vs 303:谷歌悄悄开源了一个“拆打字机”的模型,把大模型速度翻了4倍
15:23
AITOP6月11日 15:23
DiffusionGemma颠覆文本生成?自回归模型的“统治”要结束了
15:07
AITOP6月11日 15:07
每秒1107个token,Google开源的扩散模型为什么能改变本地推理格局?
6月10日
09:25
09:25arXiv cs.LG@Manuel Ricardo Guevara Garban, Yves Chemisky, Étienne Prulière, Michaël Clément, Martin Abendroth, Björn Kiefer
精选
该研究提出了一种结合长短期记忆网络(LSTM)和物理信息图神经网络(GNN)的框架,用于重建非线性、历史依赖载荷下异质微结构的局部应力场。LSTM 编码宏观应力-应变序列,捕捉路径依赖的本构响应;GNN 则重建每个时间步的空间应力场。通过引入带线性热启动的相对权重策略,平衡数据驱动重建损失和离散散度平衡惩罚,解决了弹塑性区域固定权重无法收敛的问题。模型在 10,000 条非比例加载路径上训练,比有限元仿真快三个数量级,且能泛化到两倍训练长度的加载序列,累积误差仅 1.9%。由于图依赖网格连通性而非具体单元类型,训练好的代理模型可直接应用于不同单元类型和粗细网格,无需重新训练。
论文LSTM图神经网络力学场重建多尺度仿真物理信息网络

推荐理由:做多尺度仿真和材料力学计算的团队,终于有了一个能同时处理时间依赖和空间应力场的高效替代方案——比有限元快 1000 倍,还能跨网格直接迁移,建议做结构分析的开发者点开看看。
原文
6月2日
11:09
11:09arXiv cs.AI@Yogesh Kumar Meena, Saurabh Agarwal, K. V. Arya
研究人员提出RL-ACRGNet,一种结合预训练DenseNet编码器和多级LSTM解码器的改进编码器-解码器模型,用于自动生成胸部X光报告。该模型在离策略强化学习框架下,通过双网络结构和基于度量的奖励机制优化视觉-语义嵌入,在IU-Xray数据集上BLEU-4、METEOR和ROUGE-L指标分别提升0.47%、0.17%和0.518%,并在MIMIC-CXR数据集上验证了其泛化能力。这项研究旨在解决手动生成放射报告耗时且不一致的问题,推动医学影像AI的自动化诊断流程。
论文医学影像强化学习报告生成DenseNetLSTM

推荐理由:医学影像团队终于有了更精准的自动报告生成方案——RL-ACRGNet通过强化学习优化视觉语义对齐,做医疗AI的开发者可以直接参考其双网络奖励机制来提升模型临床相关性。
原文
5月15日
09:51
09:51arXiv cs.AI@Lukas Schelenz, Shobha Rajanna, Denis Gosalci, Lucas Heublein, Jonas Pirkl, Jonathan Ott, Felix Ott, Christopher Mutschler, Tobias Feigl
精选
该论文研究了在信号处理管道中预测动态运动(如NBA球员轨迹)的挑战,传统方法如ARIMA和卡尔曼滤波难以处理非线性动态。机器学习方法如LSTM、GNN和Transformer提供了更高灵活性,但常未能显式捕捉时间依赖与上下文交互。实验表明,混合LSTM结合上下文信息在2秒预测范围内实现了最低最终位移误差1.51米,优于TCNN、GAT和Transformer,且所需数据和训练时间更少。研究强调没有单一架构在所有指标上最优,需根据任务选择模型。
论文轨迹预测LSTMGNNTransformerNBA

推荐理由:做运动轨迹预测或动态系统建模的团队,这篇论文对比了主流模型的实际表现,混合LSTM方案在效率和精度上都有亮点,值得参考。
原文
精选全部日报登录