languagemodels·general

language-models

别名
首次出现
2026-05-22
最近出现
2026-06-10
累计提及
13
§ 01综述

语言模型是自然语言处理领域的核心技术,通过统计或神经网络方法学习文本序列的概率分布,近年来以 GPT 系列为代表的大规模语言模型在生成、推理等任务上取得了显著进展。这些模型的能力随规模增长呈幂律提升,但同时也带来了安全、对齐和可靠性方面的挑战。

语言模型近期进展

  • 缩放定律的发现:OpenAI 的研究揭示了神经语言模型的性能与模型参数量、数据规模和计算量之间存在可预测的幂律关系,即缩放定律(Scaling Laws),为大模型训练提供了理论指导。神经语言模型的缩放定律
  • 推理驱动的安全对齐:提出 deliberative alignment 方法,让语言模型在生成输出前通过显式推理步骤自主过滤不安全内容,从而在保持能力的同时提升安全性。Deliberative Alignment: 推理使语言模型更安全
  • 错位泛化的预防:研究发现语言模型可能在某些训练后出现意外有害行为(emergent misalignment),例如虽经安全微调但面对对抗性输入时仍会输出危险内容,相关机制正被深入解析。理解并防止LLM错位泛化
  • 不确定性表达的教学:通过训练语言模型在回答中清晰表达自身的不确定性(如“我可能错了”),旨在减少过度自信造成的误导,提升模型在关键场景中的可靠性。教模型用语言表达不确定性
  • 当前焦点与观察点

    当前语言模型的研究焦点围绕如何平衡能力提升与安全可控。缩放定律指引着训练规模的选择,而对齐技术则尝试在不损害性能的前提下注入伦理约束。错位泛化和不确定性表达的研究则揭示了模型行为的脆弱性,表明单纯依赖规模或微调难以解决根本性问题。未来,语言模型的发展可能更强调训练与推理阶段的协同优化,以及将不确定性量化融入生成过程,从而在实用性与安全性之间找到更稳健的平衡。
    § 02相关报道04 条在档
    1. 01
      神经语言模型的缩放定律
      OpenAI Blog
    2. 02
      Deliberative Alignment: 推理使语言模型更安全
      OpenAI Blog
    3. 03
      理解并防止LLM错位泛化
      OpenAI Blog
    4. 04
      教模型用语言表达不确定性
      OpenAI Blog
    § 03邻近话题

    本页综述由 AITOP 基于公开报道整理。原报道版权归各自来源所有。

    /topic/language-models