压缩计算并非叠加计算?新论文质疑CC模型

Compressed Computation is (probably) not Computation in Superposition

精选理由

质疑CC模型的叠加假设

AI 摘要

论文研究Braun等人2025年提出的压缩计算(CC)玩具模型。该模型用50个神经元计算100个ReLU函数,但作者发现性能提升来自输入混合而非叠加计算。训练目标分为ReLU项和混合项,增益随混合矩阵幅度增大而消失。学习到的神经元方向集中在混合矩阵前50个特征值对应的子空间。基于混合矩阵的SNMF基线能复现损失轮廓,但未完全匹配训练模型。

AI 翻译 · 中文

论文研究Braun等人2025年提出的压缩计算(CC)玩具模型。该模型用50个神经元计算100个ReLU函数,但作者发现性能提升来自输入混合而非叠加计算。训练目标分为ReLU项和混合项,增益随混合矩阵幅度增大而消失。学习到的神经元方向集中在混合矩阵前50个特征值对应的子空间。基于混合矩阵的SNMF基线能复现损失轮廓,但未完全匹配训练模型。

arXiv cs.LGWe study whether the Compressed Computation (CC) toy model (Braun et al., 2025) is an instance of computation in superposition. The CC model appears to compute 100 ReLU functions with just 50 neurons, achieving a better