全部 AI 动态 · AI 热点

6月18日

09:45

09:45

arXiv cs.AI@David Aaron Evans, Jay C. Rothenberger, Kara J. Sulia, Nick P. Bassill, Chris D. Thorncroft

HRRR高分辨率数值天气预报系统的误差常与未解析的边界层过程、对流和地形诱导环流有关。已有研究用LSTM网络基于地表观测预测HRRR误差，但复杂垂直大气演变时性能下降。本文提出LSTM-ViT混合框架，融合地表序列学习与纽约州网大气廓线数据。在预测降水、10m风速和2m温度误差上，LSTM-ViT均优于基线LSTM，其中降水误差预测技能提升约两倍。改进在短预报时效和行星边界层活跃期尤为显著。

论文 LSTM Vision Transformer HRRR 天气预报预报误差

推荐理由：这篇论文用LSTM加Vision Transformer看大气垂直结构，让天气预报误差预测精度翻倍，搞气象AI的值得一读。

6月16日

20:46

AITOP6月16日 20:46

600亿美元买下Cursor，xAI终于拿到了编程工具，但真正值得跟踪的或许不是AI

600亿美元买下Cursor，xAI终于拿到了编程工具，但真正值得跟踪的或许不是AI

6月12日

13:44

13:44

arXiv cs.LG@Mohammed Bouri, Mohammed Erradi, Adnane Saoud

自然语言处理模型易受词替换攻击，现有防御主要关注一阶敏感性（梯度），但忽略了曲率（梯度变化率）的影响。本文提出S-GBT（平滑增长界张量），一种二阶方法，通过逐元素约束Hessian矩阵并加入正则化项，在训练中最小化这些界，从而获得更紧的认证鲁棒性。该方法适用于LSTM和CNN架构，在多个基准数据集上，结合一阶和二阶正则化使认证鲁棒准确率提升高达23.4%，同时保持干净准确率竞争力。研究表明，同时控制梯度及其变化是构建更鲁棒模型的有前景方向。

论文词替换攻击认证鲁棒性二阶优化 LSTM CNN

推荐理由：NLP安全研究者终于有了兼顾梯度与曲率的防御方法——S-GBT在词替换攻击下将认证鲁棒准确率提升23.4%，做文本对抗防御的团队值得关注。

12:57

AITOP6月12日 12:57

Claude代码里藏了个20260612，18个月后的AI记忆革命已经开始倒计时

6月11日

15:28

AITOP6月11日 15:28

1107 vs 303：谷歌悄悄开源了一个“拆打字机”的模型，把大模型速度翻了4倍

15:23

AITOP6月11日 15:23

DiffusionGemma颠覆文本生成？自回归模型的“统治”要结束了

15:07

AITOP6月11日 15:07

每秒1107个token，Google开源的扩散模型为什么能改变本地推理格局？

6月10日

09:25

09:25

arXiv cs.LG@Manuel Ricardo Guevara Garban, Yves Chemisky, Étienne Prulière, Michaël Clément, Martin Abendroth, Björn Kiefer

精选

该研究提出了一种结合长短期记忆网络（LSTM）和物理信息图神经网络（GNN）的框架，用于重建非线性、历史依赖载荷下异质微结构的局部应力场。LSTM 编码宏观应力-应变序列，捕捉路径依赖的本构响应；GNN 则重建每个时间步的空间应力场。通过引入带线性热启动的相对权重策略，平衡数据驱动重建损失和离散散度平衡惩罚，解决了弹塑性区域固定权重无法收敛的问题。模型在 10,000 条非比例加载路径上训练，比有限元仿真快三个数量级，且能泛化到两倍训练长度的加载序列，累积误差仅 1.9%。由于图依赖网格连通性而非具体单元类型，训练好的代理模型可直接应用于不同单元类型和粗细网格，无需重新训练。

论文 LSTM 图神经网络力学场重建多尺度仿真物理信息网络

推荐理由：做多尺度仿真和材料力学计算的团队，终于有了一个能同时处理时间依赖和空间应力场的高效替代方案——比有限元快 1000 倍，还能跨网格直接迁移，建议做结构分析的开发者点开看看。

6月2日

11:09

11:09

arXiv cs.AI@Yogesh Kumar Meena, Saurabh Agarwal, K. V. Arya

研究人员提出RL-ACRGNet，一种结合预训练DenseNet编码器和多级LSTM解码器的改进编码器-解码器模型，用于自动生成胸部X光报告。该模型在离策略强化学习框架下，通过双网络结构和基于度量的奖励机制优化视觉-语义嵌入，在IU-Xray数据集上BLEU-4、METEOR和ROUGE-L指标分别提升0.47%、0.17%和0.518%，并在MIMIC-CXR数据集上验证了其泛化能力。这项研究旨在解决手动生成放射报告耗时且不一致的问题，推动医学影像AI的自动化诊断流程。

论文医学影像强化学习报告生成 DenseNet LSTM

推荐理由：医学影像团队终于有了更精准的自动报告生成方案——RL-ACRGNet通过强化学习优化视觉语义对齐，做医疗AI的开发者可以直接参考其双网络奖励机制来提升模型临床相关性。

5月15日

09:51

09:51

arXiv cs.AI@Lukas Schelenz, Shobha Rajanna, Denis Gosalci, Lucas Heublein, Jonas Pirkl, Jonathan Ott, Felix Ott, Christopher Mutschler, Tobias Feigl

精选

该论文研究了在信号处理管道中预测动态运动（如NBA球员轨迹）的挑战，传统方法如ARIMA和卡尔曼滤波难以处理非线性动态。机器学习方法如LSTM、GNN和Transformer提供了更高灵活性，但常未能显式捕捉时间依赖与上下文交互。实验表明，混合LSTM结合上下文信息在2秒预测范围内实现了最低最终位移误差1.51米，优于TCNN、GAT和Transformer，且所需数据和训练时间更少。研究强调没有单一架构在所有指标上最优，需根据任务选择模型。

论文轨迹预测 LSTM GNN Transformer NBA

推荐理由：做运动轨迹预测或动态系统建模的团队，这篇论文对比了主流模型的实际表现，混合LSTM方案在效率和精度上都有亮点，值得参考。