10:33arXiv cs.LG@Junshu Sun, Wanxing Chang, Qingming Huang, Shuhui Wang本文提出AdaR,一种自适应递归图模型,解决预训练图模型与固定架构不匹配问题。理论分析证明步骤依赖是自适应递归收敛的充要条件。AdaR通过编码归一化步骤信息和表示-目标关系实现自适应推理,并利用梯度监督信号确保递归收敛。在归纳和直推设置下,AdaR在多项图学习中优于现有强基线模型。AI模型AdaR图学习测试时计算自适应推理递归图模型推荐理由:AdaR让图模型在测试时自己调整推理步数,不用重新训练,效果比传统图神经网络好。原文
11:28arXiv cs.AI@Jadelynn Dao, Milan Ganai, Yasmina Abukhadra, Ajay Sridhar, Mozhgan Nasr Azadani, Katie Luo, Clark Barrett, Jiajun Wu, Chelsea Finn, Marco Pavone精选72°DIRECT 是一个路由框架,利用多模态场景上下文为每个提示分配测试时计算资源,以改善成功-成本帕累托前沿。研究发现,在链式思维深度、模型大小和记忆历史三个缩放轴上,测试时计算并非均匀杠杆,不同轴带来不同能力增益。在 VLABench 和 RoboMME 上的实验表明,DIRECT 在物理 Franka 机械臂上匹配或超越更强模型的成功率,同时平均延迟降低高达 65%。该工作揭示了朴素缩放测试时计算的浪费性,为具身代理的部署提供了更高效的方案。论文具身智能测试时计算路由框架VLM机器人规划推荐理由:DIRECT 解决了具身规划中测试时计算资源浪费的问题,做机器人部署和 VLM 应用的团队可以直接参考其路由策略,在降低成本的同时保持性能。原文
11:55arXiv cs.LG@Benhao Huang, Zhengyang Geng, Zico Kolter精选Equilibrium Reasoners (EqR) 是一种新的推理框架,通过将推理过程建模为学习任务条件吸引子(latent dynamical systems)来实现可扩展的测试时计算。该框架无需外部验证器或任务特定先验,通过增加迭代深度(更多步数)和广度(聚合多个随机轨迹)来提升性能。实验表明,测试时计算的增益与向解对齐吸引子的收敛程度紧密相关。在 Sudoku-Extreme 任务上,EqR 通过展开多达 40,000 层,将前馈模型的准确率从 2.6% 提升至超过 99%。这一视角为理解迭代潜在模型中的可扩展推理提供了机制性解释。论文推理模型测试时计算吸引子可扩展性EqR推荐理由:EqR 用吸引子理论解释了为什么迭代推理能泛化,做推理模型或可扩展计算的团队值得关注——它可能改变你对测试时计算分配的理解。原文