SemRF：语言模型残差流动态的语义参考框架

精选理由

这篇论文提出SemRF框架，帮你看清语言模型内部计算如何逐层演变，用Voronoi图定位知识分布，比只看激活值更精确。

AI 摘要

SemRF（语义参考框架）通过固定锚点将语义测量与残差动态分离，解决语言模型层间解码坐标不一致问题。伪逆绑定实现精确同步，在限制双可逆性下提供稳定语义基坐标和失真边界。该框架定义语义Voronoi图，将每层分配至粗粒度单元，并保留单元内的运动和边距。通过轨迹的曲率衡量知识密度，低曲率表示分段线性可压缩性和较低的语义复杂度。实验在控制接口误差和投影残差下给出理论保证。

AI 翻译 · 中文

arXiv cs.LGResidual-stream analysis asks how language-model computation evolves across depth, but intermediate decoding requires comparable readout coordinates across layers. If embedding anchors and unembedding readout disagree on…

阅读原文