全部 AI 动态 · AI 热点

6月23日

10:33

10:33

arXiv cs.LG@Junshu Sun, Wanxing Chang, Qingming Huang, Shuhui Wang

本文提出AdaR，一种自适应递归图模型，解决预训练图模型与固定架构不匹配问题。理论分析证明步骤依赖是自适应递归收敛的充要条件。AdaR通过编码归一化步骤信息和表示-目标关系实现自适应推理，并利用梯度监督信号确保递归收敛。在归纳和直推设置下，AdaR在多项图学习中优于现有强基线模型。

AI模型 AdaR 图学习测试时计算自适应推理递归图模型

推荐理由：AdaR让图模型在测试时自己调整推理步数，不用重新训练，效果比传统图神经网络好。

6月16日

20:46

AITOP6月16日 20:46

600亿美元买下Cursor，xAI终于拿到了编程工具，但真正值得跟踪的或许不是AI

600亿美元买下Cursor，xAI终于拿到了编程工具，但真正值得跟踪的或许不是AI

6月12日

12:57

AITOP6月12日 12:57

Claude代码里藏了个20260612，18个月后的AI记忆革命已经开始倒计时

6月11日

15:28

AITOP6月11日 15:28

1107 vs 303：谷歌悄悄开源了一个“拆打字机”的模型，把大模型速度翻了4倍

15:23

AITOP6月11日 15:23

DiffusionGemma颠覆文本生成？自回归模型的“统治”要结束了

15:07

AITOP6月11日 15:07

每秒1107个token，Google开源的扩散模型为什么能改变本地推理格局？

11:28

11:28

arXiv cs.AI@Jadelynn Dao, Milan Ganai, Yasmina Abukhadra, Ajay Sridhar, Mozhgan Nasr Azadani, Katie Luo, Clark Barrett, Jiajun Wu, Chelsea Finn, Marco Pavone

精选72°

DIRECT 是一个路由框架，利用多模态场景上下文为每个提示分配测试时计算资源，以改善成功-成本帕累托前沿。研究发现，在链式思维深度、模型大小和记忆历史三个缩放轴上，测试时计算并非均匀杠杆，不同轴带来不同能力增益。在 VLABench 和 RoboMME 上的实验表明，DIRECT 在物理 Franka 机械臂上匹配或超越更强模型的成功率，同时平均延迟降低高达 65%。该工作揭示了朴素缩放测试时计算的浪费性，为具身代理的部署提供了更高效的方案。

论文具身智能测试时计算路由框架 VLM 机器人规划

推荐理由：DIRECT 解决了具身规划中测试时计算资源浪费的问题，做机器人部署和 VLM 应用的团队可以直接参考其路由策略，在降低成本的同时保持性能。

5月21日

11:55

11:55

arXiv cs.LG@Benhao Huang, Zhengyang Geng, Zico Kolter

精选

Equilibrium Reasoners (EqR) 是一种新的推理框架，通过将推理过程建模为学习任务条件吸引子（latent dynamical systems）来实现可扩展的测试时计算。该框架无需外部验证器或任务特定先验，通过增加迭代深度（更多步数）和广度（聚合多个随机轨迹）来提升性能。实验表明，测试时计算的增益与向解对齐吸引子的收敛程度紧密相关。在 Sudoku-Extreme 任务上，EqR 通过展开多达 40,000 层，将前馈模型的准确率从 2.6% 提升至超过 99%。这一视角为理解迭代潜在模型中的可扩展推理提供了机制性解释。

论文推理模型测试时计算吸引子可扩展性 EqR

推荐理由：EqR 用吸引子理论解释了为什么迭代推理能泛化，做推理模型或可扩展计算的团队值得关注——它可能改变你对测试时计算分配的理解。