精选理由
这篇论文用实验硬数据展示了尖峰智能体如何通过自我因果信用形成持久行为,对比了多种条件,对构建有自我认知的AI很有启发。
论文在Nengo LIF/PES尖峰网络上展示了agency-gated slow credit机制。实验显示,移除缓冲区后自我保存行为保留分数0.96(N=50),慢解码器重置或去门后行为崩溃。在24维部分观测控制中,自我信用产生持久行为(0.74 vs 0.00)。多任务学习中,乘法否决防止遗忘,最终准确率0.88,遗忘0.13,而基线方案性能接近随机。论文将持久残留形式化为操作性的行为自我。
AI 翻译 · 中文
论文在Nengo LIF/PES尖峰网络上展示了agency-gated slow credit机制。实验显示,移除缓冲区后自我保存行为保留分数0.96(N=50),慢解码器重置或去门后行为崩溃。在24维部分观测控制中,自我信用产生持久行为(0.74 vs 0.00)。多任务学习中,乘法否决防止遗忘,最终准确率0.88,遗忘0.13,而基线方案性能接近随机。论文将持久残留形式化为操作性的行为自我。
How does an agent that can tell self from world come to be durably shaped by that distinction? Recent work shows that a predictive system can detect its own agency (Ye, 2026), but detecting agency does not explain durabl…