Handlebars模板中三花括号插值导致LLM角色注入风险

Structural Role Injection in Handlebars-Templated LLM Prompts: Triple-Brace Interpolation, Delimiter Family, and the Limits of HTML Auto-Escaping

精选理由

这篇论文用具体数据告诉你,Handlebars的{{}}和{{{}}}差别有多大,以及为什么别指望HTML转义防注入。

AI 摘要

该论文分析了Handlebars模板引擎中双花括号{{x}}和三角花括号{{{x}}}对LLM提示注入的影响。双花括号HTML转义尖括号但不转义方括号、冒号或Markdown井号,导致ChatML、Llama-3和XML分隔符存活率为0.00,而Llama-2 [INST]、Human:/Assistant:和Markdown ###分隔符存活率为1.00。在5760次试验中,GPT-3.5 Turbo在原始插值下任务劫持成功率达97%,在转义下为91%。Claude Haiku 4.5几乎完全抵抗两种攻击。转义默认值仅对HTML转义覆盖的分隔符方案有效,无法替代指令与数据的结构化分离。

AI 翻译 · 中文

该论文分析了Handlebars模板引擎中双花括号{{x}}和三角花括号{{{x}}}对LLM提示注入的影响。双花括号HTML转义尖括号但不转义方括号、冒号或Markdown井号,导致ChatML、Llama-3和XML分隔符存活率为0.00,而Llama-2 [INST]、Human:/Assistant:和Markdown ###分隔符存活率为1.00。在5760次试验中,GPT-3.5 Turbo在原始插值下任务劫持成功率达97%,在转义下为91%。Claude Haiku 4.5几乎完全抵抗两种攻击。转义默认值仅对HTML转义覆盖的分隔符方案有效,无法替代指令与数据的结构化分离。

arXiv cs.LGLarge language model applications build prompts from templates, and Handlebars is a widely used templating engine and the default prompt-template format in Microsoft Semantic Kernel. Its double-brace {x} expression HTML-