AITP
精选全部 AI 动态AI 日报Agent 接入关于更新日志信源提报反馈
登录 / 注册
AITOP
全部 AI 动态
AI 相关资讯全量信息流
全部博客资讯推文论文
全部模型产品行业论文技巧
标签:语言模型×
5月13日
21:35
Anthropic: Transformer Circuits(资讯)
60
Gurnee 等人 2025 年的研究揭示了语言模型在计数任务中背后的几何机制。他们发现模型内部存在一种流形结构,用于表示和操作数字信息。这项研究通过分析模型在特定任务中的内部表示,展示了模型如何通过几何变换来执行计数。这为理解语言模型的内部工作原理提供了新的视角,有助于开发更可解释的 AI 系统。
论文语言模型几何结构计数任务可解释性内部机制

推荐理由:对理解大模型内部机制的研究者来说,这篇论文揭示了计数任务背后的几何结构,值得深入阅读。
5月11日
22:16
AK@_akhaliq
40
该论文提出了一种连续潜在扩散语言模型(Continuous Latent Diffusion Language Model),将扩散模型应用于语言建模的潜在空间。与传统自回归模型不同,该方法在连续潜在空间中进行迭代去噪,可能提升生成质量和效率。论文展示了模型在文本生成任务上的初步结果,为语言建模提供了新的研究方向。这一工作将视觉领域成功的扩散模型扩展到自然语言处理,具有重要的理论意义和实践潜力。
论文扩散模型语言模型论文文本生成

推荐理由:这是扩散模型应用于语言建模的又一探索,为NLP领域提供了非自回归的新思路,值得关注其在文本生成和编辑等场景的后续进展。