llama2·general

LLaMA-2

别名
首次出现
2026-06-02
最近出现
2026-06-17
累计提及
9
§ 01综述

LLaMA-2 是 Meta 在 2023 年发布的开源大型语言模型系列,包括 7B、13B 和 70B 三个参数规模,并开放免费用于研究和商业用途,迅速成为学界和工业界研究和应用的重要基座模型。近期围绕 LLaMA-2 等开源 LLM 的研究,在安全性、事实性、持续学习和训练稳定性等方面取得了突破性进展。

LLaMA-2 近期进展

  • LLM 安全性风险:一项研究发现,在使用 Handlebars 模板时,三花括号插值可能引入 LLM 角色注入攻击,导致模型偏离预期行为。这一漏洞对 LLaMA-2 等基于模板的部署场景构成威胁。原文标题:Handlebars模板中三花括号插值导致LLM角色注入风险
  • 事实性增强:通过挖掘模型家族(如 LLaMA-2 系列)中的“继承真实头”,研究人员发现这些注意力头在不同模型间共享事实知识,利用它们可以显著提升上下文真实性和可信度。原文标题:家庭真相:利用模型家族中的继承真实头增强上下文真实性
  • 持续学习能力改进:针对 LLaMA-2 在微调新任务时容易遗忘旧知识的问题,SETA 方法通过稀疏子空间专家共享机制,有效缓解了灾难性遗忘,保持模型在多个任务上的稳定性能。原文标题:SETA:稀疏子空间专家共享解决LLM持续学习灾难性遗忘
  • 低精度训练稳定性:针对 LLaMA-2 等大模型在低精度训练(如 FP8)中出现的运行时不稳定问题,GNMR 方法提供了动态调节精度的策略,确保训练过程稳定收敛,降低硬件需求。原文标题:GNMR:低精度大模型训练的运行时稳定性控制方法
  • 当前焦点与观察点

    当前对 LLaMA-2 的研究焦点正从单纯的性能提升转向更可靠、更安全的部署技术。安全漏洞(如角色注入)揭示了开源模型在应用层面面临的严峻挑战;事实性增强方法则试图弥补 LLM 生成内容不可靠的固有缺陷。持续学习和训练稳定性方面的创新,进一步推动了 LLaMA-2 在更复杂场景下的实用化。整体来看,这些工作共同指向一个方向:让 LLaMA-2 在保持强大生成能力的同时,变得更加可控、安全且易于维护。

    § 02相关报道04 条在档
    1. 01
      Handlebars模板中三花括号插值导致LLM角色注入风险
      arXiv cs.LG
    2. 02
      家庭真相:利用模型家族中的继承真实头增强上下文真实性
      arXiv cs.LG
    3. 03
      SETA:稀疏子空间专家共享解决LLM持续学习灾难性遗忘
      arXiv cs.AI
    4. 04
      GNMR:低精度大模型训练的运行时稳定性控制方法
      arXiv: DeepSeek
    § 03邻近话题

    本页综述由 AITOP 基于公开报道整理。原报道版权归各自来源所有。

    /topic/LLaMA-2