LLaMA-2

§ 01综述

LLaMA-2 是 Meta 在 2023 年发布的开源大型语言模型系列，包括 7B、13B 和 70B 三个参数规模，并开放免费用于研究和商业用途，迅速成为学界和工业界研究和应用的重要基座模型。近期围绕 LLaMA-2 等开源 LLM 的研究，在安全性、事实性、持续学习和训练稳定性等方面取得了突破性进展。

LLaMA-2 近期进展

LLM 安全性风险：一项研究发现，在使用 Handlebars 模板时，三花括号插值可能引入 LLM 角色注入攻击，导致模型偏离预期行为。这一漏洞对 LLaMA-2 等基于模板的部署场景构成威胁。原文标题：Handlebars模板中三花括号插值导致LLM角色注入风险

事实性增强：通过挖掘模型家族（如 LLaMA-2 系列）中的“继承真实头”，研究人员发现这些注意力头在不同模型间共享事实知识，利用它们可以显著提升上下文真实性和可信度。原文标题：家庭真相：利用模型家族中的继承真实头增强上下文真实性

持续学习能力改进：针对 LLaMA-2 在微调新任务时容易遗忘旧知识的问题，SETA 方法通过稀疏子空间专家共享机制，有效缓解了灾难性遗忘，保持模型在多个任务上的稳定性能。原文标题：SETA：稀疏子空间专家共享解决LLM持续学习灾难性遗忘

低精度训练稳定性：针对 LLaMA-2 等大模型在低精度训练（如 FP8）中出现的运行时不稳定问题，GNMR 方法提供了动态调节精度的策略，确保训练过程稳定收敛，降低硬件需求。原文标题：GNMR：低精度大模型训练的运行时稳定性控制方法

当前焦点与观察点

当前对 LLaMA-2 的研究焦点正从单纯的性能提升转向更可靠、更安全的部署技术。安全漏洞（如角色注入）揭示了开源模型在应用层面面临的严峻挑战；事实性增强方法则试图弥补 LLM 生成内容不可靠的固有缺陷。持续学习和训练稳定性方面的创新，进一步推动了 LLaMA-2 在更复杂场景下的实用化。整体来看，这些工作共同指向一个方向：让 LLaMA-2 在保持强大生成能力的同时，变得更加可控、安全且易于维护。

§ 02相关报道04 条在档

§ 03邻近话题