AITP
精选全部 AI 动态AI 日报Agent 接入关于更新日志信源提报反馈
登录 / 注册
AITOP
全部 AI 动态
AI 相关资讯全量信息流
全部博客资讯推文论文
全部模型产品行业论文技巧
标签:测试时计算×
6月23日
10:33
10:33arXiv cs.LG@Junshu Sun, Wanxing Chang, Qingming Huang, Shuhui Wang
本文提出AdaR,一种自适应递归图模型,解决预训练图模型与固定架构不匹配问题。理论分析证明步骤依赖是自适应递归收敛的充要条件。AdaR通过编码归一化步骤信息和表示-目标关系实现自适应推理,并利用梯度监督信号确保递归收敛。在归纳和直推设置下,AdaR在多项图学习中优于现有强基线模型。
AI模型AdaR图学习测试时计算自适应推理递归图模型

推荐理由:AdaR让图模型在测试时自己调整推理步数,不用重新训练,效果比传统图神经网络好。
原文
6月16日
20:46
AITOP6月16日 20:46
600亿美元买下Cursor,xAI终于拿到了编程工具,但真正值得跟踪的或许不是AI600亿美元买下Cursor,xAI终于拿到了编程工具,但真正值得跟踪的或许不是AI
6月12日
12:57
AITOP6月12日 12:57
Claude代码里藏了个20260612,18个月后的AI记忆革命已经开始倒计时
6月11日
15:28
AITOP6月11日 15:28
1107 vs 303:谷歌悄悄开源了一个“拆打字机”的模型,把大模型速度翻了4倍
15:23
AITOP6月11日 15:23
DiffusionGemma颠覆文本生成?自回归模型的“统治”要结束了
15:07
AITOP6月11日 15:07
每秒1107个token,Google开源的扩散模型为什么能改变本地推理格局?
11:28
11:28arXiv cs.AI@Jadelynn Dao, Milan Ganai, Yasmina Abukhadra, Ajay Sridhar, Mozhgan Nasr Azadani, Katie Luo, Clark Barrett, Jiajun Wu, Chelsea Finn, Marco Pavone
精选72°
DIRECT 是一个路由框架,利用多模态场景上下文为每个提示分配测试时计算资源,以改善成功-成本帕累托前沿。研究发现,在链式思维深度、模型大小和记忆历史三个缩放轴上,测试时计算并非均匀杠杆,不同轴带来不同能力增益。在 VLABench 和 RoboMME 上的实验表明,DIRECT 在物理 Franka 机械臂上匹配或超越更强模型的成功率,同时平均延迟降低高达 65%。该工作揭示了朴素缩放测试时计算的浪费性,为具身代理的部署提供了更高效的方案。
论文具身智能测试时计算路由框架VLM机器人规划

推荐理由:DIRECT 解决了具身规划中测试时计算资源浪费的问题,做机器人部署和 VLM 应用的团队可以直接参考其路由策略,在降低成本的同时保持性能。
原文
5月21日
11:55
11:55arXiv cs.LG@Benhao Huang, Zhengyang Geng, Zico Kolter
精选
Equilibrium Reasoners (EqR) 是一种新的推理框架,通过将推理过程建模为学习任务条件吸引子(latent dynamical systems)来实现可扩展的测试时计算。该框架无需外部验证器或任务特定先验,通过增加迭代深度(更多步数)和广度(聚合多个随机轨迹)来提升性能。实验表明,测试时计算的增益与向解对齐吸引子的收敛程度紧密相关。在 Sudoku-Extreme 任务上,EqR 通过展开多达 40,000 层,将前馈模型的准确率从 2.6% 提升至超过 99%。这一视角为理解迭代潜在模型中的可扩展推理提供了机制性解释。
论文推理模型测试时计算吸引子可扩展性EqR

推荐理由:EqR 用吸引子理论解释了为什么迭代推理能泛化,做推理模型或可扩展计算的团队值得关注——它可能改变你对测试时计算分配的理解。
原文
精选全部日报登录