09:34arXiv cs.AI@Nicolas Flammarion, Chirag Pabbaraju, Hristo Papazov, Miltiadis Stouras, Ola Svensson精选该论文提出一种资源感知的语言生成极限理论框架,在空间效率约束下研究从对抗性正例流中学习目标语言。主要结果:当允许指数空间时,学习器能精确识别目标语言K;在多项式空间约束下,给出一种使用poly(s,k)空间的流式算法,其生成间隙Δ=O(k^{2s-2}),并能捕获K中所有长度≥2s-1的字符串。通过通信复杂度归约证明下界:要达到生成间隙Δ≤k^{(1-ε)s},需要k^{Ω(εs)}内存。这些结果揭示了多项式空间生成与指数空间精确识别之间的尖锐转变。论文语言生成有穷自动机空间复杂度流式算法推荐理由:这篇论文为空间受限下的语言学习建立了严格理论框架,给出了指数和多项式空间下的精确界限,对理解计算资源与生成能力的关系很有启发。原文
11:06arXiv cs.AI@Jon Kleinberg, Anay Mehrotra, Amin Saberi, Grigoris Velegkas这篇论文研究了在有限记忆条件下语言生成的理论极限。传统研究假设学习者能访问全部历史数据,但现实算法只能保留有限信息。作者首先证明了在温和的枚举限制下,即使没有记忆,任何可数无限语言集合仍可生成;否则,他们精确刻画了无记忆生成可行的条件。对于有限集合,他们利用Sperner定理和对称链分解给出了无记忆生成器能达到的最优极小极大密度。进一步发现,滑动窗口(最近W个样本)不改善最坏情况密度,而自适应存储b个历史样本则能提升密度。最后,他们重新审视了极限识别问题,证明在仅记忆上一次猜测的增量变体中,精确识别对三个语言集合即失败,但放宽到“近似”版本后,对任何有限集合都可行。论文语言生成有界记忆学习理论极限识别Sperner定理推荐理由:这篇论文为有界记忆下的语言生成建立了理论基础,对设计内存受限的AI生成系统(如边缘设备上的语言模型)有直接指导意义。做理论或系统优化的开发者值得关注其中的密度与识别界限。原文