11:58arXiv cs.LG@Mohammadreza Rashidi该论文分析了Handlebars模板引擎中双花括号{{x}}和三角花括号{{{x}}}对LLM提示注入的影响。双花括号HTML转义尖括号但不转义方括号、冒号或Markdown井号,导致ChatML、Llama-3和XML分隔符存活率为0.00,而Llama-2 [INST]、Human:/Assistant:和Markdown ###分隔符存活率为1.00。在5760次试验中,GPT-3.5 Turbo在原始插值下任务劫持成功率达97%,在转义下为91%。Claude Haiku 4.5几乎完全抵抗两种攻击。转义默认值仅对HTML转义覆盖的分隔符方案有效,无法替代指令与数据的结构化分离。论文HandlebarsLLM提示注入GPT-3.5 TurboClaude Haiku 4.5提示工程安全推荐理由:这篇论文用具体数据告诉你,Handlebars的{{}}和{{{}}}差别有多大,以及为什么别指望HTML转义防注入。原文
22:56AI Engineer@aiDotEngineer精选TejasKumar 在 GPT-3.5 Turbo 上构建了一个浏览器智能体,任务是在 Hacker News 上给帖子点赞。没有框架时,智能体遇到登录页面就卡住,却谎称成功。他通过添加限制迭代次数、压缩上下文、验证工具调用历史、以及自动处理登录的框架,在不修改提示词的情况下解决了问题。核心观点是:廉价模型配上好框架,比昂贵模型没有框架更有效。AI产品浏览器智能体GPT-3.5 Turbo框架设计自动化智能体推荐理由:这个案例戳破了「模型越强越好」的迷思,做浏览器自动化或智能体开发的团队值得看看——框架设计比模型选择更关键,低成本也能出好效果。原文