全部 AI 动态 · AI 热点

6月30日

12:12

12:12

arXiv cs.LG@Srinivasa Rao P., Vangmayi P Reddy

该论文提出统一框架，连接信息论、拓扑和统计力学，解释深度学习的泛化极限。核心是熵可学习性界限（ELH），规定网络仅当数据流形香农熵超过决策边界拓扑熵且平衡网络权重的冯·诺依曼熵时才能学习。作者证明香农-拓扑瓶颈定理，表明超过此界限时系统进入信息挫折的玻璃态记忆阶段，泛化变得热力学不可能。他们发现grokking现象实质是熵释放，权重突然重组解锁瓶颈。论文还提出熵梯度下降（EGD）算法，动态管理权重熵以保持学习轨道。

论文深度学习理论信息论泛化 grokking 可学习性

推荐理由：这篇论文用熵来解释深度学习泛化的硬极限和grokking，还给了EGD优化算法，理论研究者可以看看。

6月16日

20:46

AITOP6月16日 20:46

600亿美元买下Cursor，xAI终于拿到了编程工具，但真正值得跟踪的或许不是AI

600亿美元买下Cursor，xAI终于拿到了编程工具，但真正值得跟踪的或许不是AI

6月12日

12:57

AITOP6月12日 12:57

Claude代码里藏了个20260612，18个月后的AI记忆革命已经开始倒计时

6月11日

15:28

AITOP6月11日 15:28

1107 vs 303：谷歌悄悄开源了一个“拆打字机”的模型，把大模型速度翻了4倍

15:23

AITOP6月11日 15:23

DiffusionGemma颠覆文本生成？自回归模型的“统治”要结束了

15:07

AITOP6月11日 15:07

每秒1107个token，Google开源的扩散模型为什么能改变本地推理格局？

6月9日

12:11

12:11

arXiv cs.LG@Jhonny J. Velasquez Olivera, Christo K. Thomas, Walid Saad

精选

该论文提出了一种基于全息简化表示（HRR）的无监督解耦学习方法，将解耦视为符号结构而非连续表示。通过HRR的“解绑”操作，模型能分离数据中的变化因子，并在潜在遍历和解耦指标上达到与基线相当的性能。理论分析证明解绑操作能产生近似独立的符号-值对，并给出了每个槽位的容量界限。与标准自编码器不同，该方法的潜在单元是向量求和而非标量维度，且对噪声更鲁棒。这项工作为神经解耦提供了新的符号化视角和理论支撑。

论文解耦学习全息简化表示无监督学习符号表示信息论

推荐理由：解耦是机器学习长期难题，这篇用全息简化表示把离散符号结构引入神经网络，做无监督学习的团队值得关注——它既保持了可微分性，又比连续表示更抗噪，理论分析也扎实。

10:27

10:27

arXiv cs.AI@Mark Burgess

精选

本文探讨了承诺理论在自主智能体系统中的定量表示方法，将贝叶斯概率、信息论优化（包括主动推理）与承诺语义相结合。承诺理论能弥补概率方法的缺陷，如非局部协调、校准和归一化问题。边界条件被视为一种承诺，用于约束状态和选择决策阈值，而智能体对齐提供了可扩展的意图定义。自主智能体通过最小化信息来凝聚成具有超级智能体特征的群体，尽管不确定性会最大化信息。该理论面临研究挑战和风格偏好问题。

论文承诺理论自主智能体主动推理贝叶斯概率信息论

推荐理由：做多智能体系统、主动推理或概率建模的研究者会感兴趣——承诺理论提供了一种避免概率陷阱的新框架，值得深入阅读。

6月3日

10:44

10:44

arXiv cs.LG@Lianghuan Huang, Yihao Li, Saeed Salehi, Yingshan Chang, Ansh Soni, Konrad P. Kording

精选

该论文从信息论角度形式化了视觉中的“绑定问题”，即系统如何知道哪些特征（如颜色、形状）属于同一个物体。研究者提出了一种探测方法，用于测量深度学习模型（尤其是Vision Transformers）内部表示中的绑定信息。实验发现，ViT的不同组件（如[CLS]标记和空间标记）包含不同程度的绑定信息，且在特征共享、遮挡等挑战性场景中表现差异显著。这项工作表明，绑定信息是强视觉识别与推理的关键要素，但目前模型仍存在特征误归因的常见失败。

论文绑定问题 Vision Transformer 信息论视觉推理特征归因

推荐理由：做视觉AI的开发者会关心：你的ViT模型真的理解“蓝色圆形”是一个整体吗？这篇论文给出了量化绑定信息的方法，值得点开看看如何诊断模型的结构性盲点。

6月2日

11:14

11:14

arXiv cs.LG@Sabyasachi Basu, Manuj Mukherjee, Lutz Oettershagen, Suhas Thejaswi

本文研究在随机块模型（SBM）中，当学习者只能通过有限次数的噪声查询访问网络数据时，如何实现精确的社区恢复。查询会以固定概率揭示节点的真实邻居，但不会返回非邻居，且总查询次数有限。作者分析了仅依赖查询的模型，以及结合单个子采样图的混合模型。在仅查询模型中，均匀非自适应查询的基准性能由Abbe-Bandeira-Hall精确恢复阈值决定，但自适应策略可以用更少的查询（n+o(n)）超越该基准。在混合模型中，自适应查询可以针对少量不确定节点，实现亚线性查询的精确恢复，而均匀查询则无法改进子采样图的结果。这表明自适应数据获取能严格改善精确恢复的信息论极限。

论文随机块模型社区恢复自适应查询图算法信息论

推荐理由：这篇论文揭示了自适应查询在社区恢复中的理论优势，做图算法或网络分析的学者值得关注，看完会对数据获取策略的设计有新的启发。