SemRF:语言模型残差流动态的语义参考框架

SemRF: A Semantic Reference Frame for Residual-Stream Dynamics in Language Models

精选理由

这篇论文提出SemRF框架,帮你看清语言模型内部计算如何逐层演变,用Voronoi图定位知识分布,比只看激活值更精确。

AI 摘要

SemRF(语义参考框架)通过固定锚点将语义测量与残差动态分离,解决语言模型层间解码坐标不一致问题。伪逆绑定实现精确同步,在限制双可逆性下提供稳定语义基坐标和失真边界。该框架定义语义Voronoi图,将每层分配至粗粒度单元,并保留单元内的运动和边距。通过轨迹的曲率衡量知识密度,低曲率表示分段线性可压缩性和较低的语义复杂度。实验在控制接口误差和投影残差下给出理论保证。

AI 翻译 · 中文

SemRF(语义参考框架)通过固定锚点将语义测量与残差动态分离,解决语言模型层间解码坐标不一致问题。伪逆绑定实现精确同步,在限制双可逆性下提供稳定语义基坐标和失真边界。该框架定义语义Voronoi图,将每层分配至粗粒度单元,并保留单元内的运动和边距。通过轨迹的曲率衡量知识密度,低曲率表示分段线性可压缩性和较低的语义复杂度。实验在控制接口误差和投影残差下给出理论保证。

arXiv cs.LGResidual-stream analysis asks how language-model computation evolves across depth, but intermediate decoding requires comparable readout coordinates across layers. If embedding anchors and unembedding readout disagree on