AITP
精选全部 AI 动态AI 日报Agent 接入关于更新日志信源提报反馈
登录 / 注册
AITOP
全部 AI 动态
AI 相关资讯全量信息流
全部博客资讯推文论文
全部模型产品行业论文技巧
标签:轨迹预测×
6月16日
20:46
AITOP6月16日 20:46
600亿美元买下Cursor,xAI终于拿到了编程工具,但真正值得跟踪的或许不是AI600亿美元买下Cursor,xAI终于拿到了编程工具,但真正值得跟踪的或许不是AI
6月12日
12:57
AITOP6月12日 12:57
Claude代码里藏了个20260612,18个月后的AI记忆革命已经开始倒计时
6月11日
15:28
AITOP6月11日 15:28
1107 vs 303:谷歌悄悄开源了一个“拆打字机”的模型,把大模型速度翻了4倍
15:23
AITOP6月11日 15:23
DiffusionGemma颠覆文本生成?自回归模型的“统治”要结束了
15:07
AITOP6月11日 15:07
每秒1107个token,Google开源的扩散模型为什么能改变本地推理格局?
5月21日
09:46
09:46arXiv cs.AI@Junsung Park, Hyunjung Shim
精选
现有驾驶视觉-语言-动作模型(Driving VLA)在轨迹预测时严重忽视视觉特征,原因是任务定义存在结构性缺陷。研究者从逆运动学角度重新设计,要求模型预测未来视觉状态作为边界条件,并引入独立逆运动学网络(交叉注意力条件扩散模型)来抑制对自车状态和文本指令的捷径依赖。仅用0.5B参数,该模型在NAVSIM-v2和nuScenes基准测试中达到7B-8B大模型的轨迹规划性能,尤其在动态驾驶场景(如转弯)中视觉特征利用显著提升。
论文Driving VLA逆运动学轨迹预测自动驾驶视觉特征

推荐理由:这篇论文用逆运动学原理解决了Driving VLA忽视视觉特征的顽疾,做自动驾驶轨迹规划的团队值得关注——0.5B模型就能达到7B-8B的效果,意味着更低的部署成本和更好的视觉鲁棒性。
原文
5月15日
09:51
09:51arXiv cs.AI@Lukas Schelenz, Shobha Rajanna, Denis Gosalci, Lucas Heublein, Jonas Pirkl, Jonathan Ott, Felix Ott, Christopher Mutschler, Tobias Feigl
精选
该论文研究了在信号处理管道中预测动态运动(如NBA球员轨迹)的挑战,传统方法如ARIMA和卡尔曼滤波难以处理非线性动态。机器学习方法如LSTM、GNN和Transformer提供了更高灵活性,但常未能显式捕捉时间依赖与上下文交互。实验表明,混合LSTM结合上下文信息在2秒预测范围内实现了最低最终位移误差1.51米,优于TCNN、GAT和Transformer,且所需数据和训练时间更少。研究强调没有单一架构在所有指标上最优,需根据任务选择模型。
论文轨迹预测LSTMGNNTransformerNBA

推荐理由:做运动轨迹预测或动态系统建模的团队,这篇论文对比了主流模型的实际表现,混合LSTM方案在效率和精度上都有亮点,值得参考。
原文
精选全部日报登录