全部 AI 动态 · AI 热点

6月16日

20:46

AITOP6月16日 20:46

600亿美元买下Cursor，xAI终于拿到了编程工具，但真正值得跟踪的或许不是AI

600亿美元买下Cursor，xAI终于拿到了编程工具，但真正值得跟踪的或许不是AI

6月12日

12:57

AITOP6月12日 12:57

Claude代码里藏了个20260612，18个月后的AI记忆革命已经开始倒计时

6月11日

15:28

AITOP6月11日 15:28

1107 vs 303：谷歌悄悄开源了一个“拆打字机”的模型，把大模型速度翻了4倍

15:23

AITOP6月11日 15:23

DiffusionGemma颠覆文本生成？自回归模型的“统治”要结束了

15:07

AITOP6月11日 15:07

每秒1107个token，Google开源的扩散模型为什么能改变本地推理格局？

6月4日

11:21

11:21

arXiv cs.LG@Vasiliki Rizou, Pascal Frossard, Dorina Thanou

精选

多模态数据解耦表示学习能分离共享与独特特征，但现有方法局限于双模态场景。RePercENT 提出自监督框架，通过即插即用架构直接处理预提取嵌入，无需联合预训练，支持任意数量模态。该框架引入联合优化目标同时学习共享与独特成分，并提供理论最优性保证。实验表明，RePercENT 在多种模态和任务中成功恢复解耦成分，性能持平且计算复杂度显著降低。这为多模态AI系统（如自动驾驶、医疗诊断）提供了可扩展的基础方案。

论文多模态学习解耦表示学习自监督学习即插即用架构可扩展性

推荐理由：多模态数据解耦是AI理解复杂场景的关键，但双模态瓶颈长期未解。做多模态学习、跨模态推理的团队可以直接用RePercENT的即插即用架构，无需重新训练基础模型，值得关注。

5月21日

11:55

11:55

arXiv cs.LG@Benhao Huang, Zhengyang Geng, Zico Kolter

精选

Equilibrium Reasoners (EqR) 是一种新的推理框架，通过将推理过程建模为学习任务条件吸引子（latent dynamical systems）来实现可扩展的测试时计算。该框架无需外部验证器或任务特定先验，通过增加迭代深度（更多步数）和广度（聚合多个随机轨迹）来提升性能。实验表明，测试时计算的增益与向解对齐吸引子的收敛程度紧密相关。在 Sudoku-Extreme 任务上，EqR 通过展开多达 40,000 层，将前馈模型的准确率从 2.6% 提升至超过 99%。这一视角为理解迭代潜在模型中的可扩展推理提供了机制性解释。

论文推理模型测试时计算吸引子可扩展性 EqR

推荐理由：EqR 用吸引子理论解释了为什么迭代推理能泛化，做推理模型或可扩展计算的团队值得关注——它可能改变你对测试时计算分配的理解。

5月14日

13:26

13:26

arXiv cs.LG@Eszter Varga-Umbrich, Zachary Weller-Davies, Paul Duckworth, Jules Tilly, Olivier Peltre, Shikha Surana

精选

该研究提出一种基于分块特征空间后验方差筛选的线性扩展采集框架，避免候选集和训练集核矩阵的显式构建，可在数小时内筛选约20万结构。研究将神经正切核扩展到力感知场景，通过混合参数-坐标导数得到力NTK和联合能量-力NTK，为向量场预测提供自然相似性度量。在OC20数据集上，联合能量-力NTK在所有指标和分布划分下取得最低能量和力MAE及RMSE。在T1x、PMechDB和RGD基准测试中，力NTK方法在保持与基线竞争力同时，比基于委员会的方法显著更高效。在T1x的候选池偏移案例中，基于预训练MLIP嵌入和NTK的采集方法保持鲁棒，而委员会方法方差更高。结果表明，单个预训练MLIP即可实现可扩展、力感知且分布鲁棒的主动学习，用于基础模型微调。

论文主动学习神经正切核力感知机器学习势可扩展性

推荐理由：做分子动力学模拟或材料计算的团队，终于有了一个能同时处理能量和力的主动学习框架，效率比委员会方法高得多，建议做MLIP微调的直接试试。