AITP
精选全部 AI 动态AI 日报Agent 接入关于更新日志信源提报反馈
登录 / 注册
AITOP
全部 AI 动态
AI 相关资讯全量信息流
全部博客资讯推文论文
全部模型产品行业论文技巧
标签:语言生成×
6月25日
09:34
09:34arXiv cs.AI@Nicolas Flammarion, Chirag Pabbaraju, Hristo Papazov, Miltiadis Stouras, Ola Svensson
精选
该论文提出一种资源感知的语言生成极限理论框架,在空间效率约束下研究从对抗性正例流中学习目标语言。主要结果:当允许指数空间时,学习器能精确识别目标语言K;在多项式空间约束下,给出一种使用poly(s,k)空间的流式算法,其生成间隙Δ=O(k^{2s-2}),并能捕获K中所有长度≥2s-1的字符串。通过通信复杂度归约证明下界:要达到生成间隙Δ≤k^{(1-ε)s},需要k^{Ω(εs)}内存。这些结果揭示了多项式空间生成与指数空间精确识别之间的尖锐转变。
论文语言生成有穷自动机空间复杂度流式算法

推荐理由:这篇论文为空间受限下的语言学习建立了严格理论框架,给出了指数和多项式空间下的精确界限,对理解计算资源与生成能力的关系很有启发。
原文
6月16日
20:46
AITOP6月16日 20:46
600亿美元买下Cursor,xAI终于拿到了编程工具,但真正值得跟踪的或许不是AI600亿美元买下Cursor,xAI终于拿到了编程工具,但真正值得跟踪的或许不是AI
6月12日
12:57
AITOP6月12日 12:57
Claude代码里藏了个20260612,18个月后的AI记忆革命已经开始倒计时
6月11日
15:28
AITOP6月11日 15:28
1107 vs 303:谷歌悄悄开源了一个“拆打字机”的模型,把大模型速度翻了4倍
15:23
AITOP6月11日 15:23
DiffusionGemma颠覆文本生成?自回归模型的“统治”要结束了
15:07
AITOP6月11日 15:07
每秒1107个token,Google开源的扩散模型为什么能改变本地推理格局?
5月29日
11:06
11:06arXiv cs.AI@Jon Kleinberg, Anay Mehrotra, Amin Saberi, Grigoris Velegkas
这篇论文研究了在有限记忆条件下语言生成的理论极限。传统研究假设学习者能访问全部历史数据,但现实算法只能保留有限信息。作者首先证明了在温和的枚举限制下,即使没有记忆,任何可数无限语言集合仍可生成;否则,他们精确刻画了无记忆生成可行的条件。对于有限集合,他们利用Sperner定理和对称链分解给出了无记忆生成器能达到的最优极小极大密度。进一步发现,滑动窗口(最近W个样本)不改善最坏情况密度,而自适应存储b个历史样本则能提升密度。最后,他们重新审视了极限识别问题,证明在仅记忆上一次猜测的增量变体中,精确识别对三个语言集合即失败,但放宽到“近似”版本后,对任何有限集合都可行。
论文语言生成有界记忆学习理论极限识别Sperner定理

推荐理由:这篇论文为有界记忆下的语言生成建立了理论基础,对设计内存受限的AI生成系统(如边缘设备上的语言模型)有直接指导意义。做理论或系统优化的开发者值得关注其中的密度与识别界限。
原文
精选全部日报登录