全部 AI 动态 · AI 热点

6月17日

11:58

11:58

arXiv cs.LG@Mohammadreza Rashidi

该论文分析了Handlebars模板引擎中双花括号{{x}}和三角花括号{{{x}}}对LLM提示注入的影响。双花括号HTML转义尖括号但不转义方括号、冒号或Markdown井号，导致ChatML、Llama-3和XML分隔符存活率为0.00，而Llama-2 [INST]、Human:/Assistant:和Markdown ###分隔符存活率为1.00。在5760次试验中，GPT-3.5 Turbo在原始插值下任务劫持成功率达97%，在转义下为91%。Claude Haiku 4.5几乎完全抵抗两种攻击。转义默认值仅对HTML转义覆盖的分隔符方案有效，无法替代指令与数据的结构化分离。

论文 Handlebars LLM提示注入 GPT-3.5 Turbo Claude Haiku 4.5 提示工程安全

推荐理由：这篇论文用具体数据告诉你，Handlebars的{{}}和{{{}}}差别有多大，以及为什么别指望HTML转义防注入。

6月16日

20:46

AITOP6月16日 20:46

600亿美元买下Cursor，xAI终于拿到了编程工具，但真正值得跟踪的或许不是AI

600亿美元买下Cursor，xAI终于拿到了编程工具，但真正值得跟踪的或许不是AI

6月12日

12:57

AITOP6月12日 12:57

Claude代码里藏了个20260612，18个月后的AI记忆革命已经开始倒计时

6月11日

15:28

AITOP6月11日 15:28

1107 vs 303：谷歌悄悄开源了一个“拆打字机”的模型，把大模型速度翻了4倍

15:23

AITOP6月11日 15:23

DiffusionGemma颠覆文本生成？自回归模型的“统治”要结束了

15:07

AITOP6月11日 15:07

每秒1107个token，Google开源的扩散模型为什么能改变本地推理格局？

5月18日

22:56

22:56

AI Engineer@aiDotEngineer

精选

TejasKumar 在 GPT-3.5 Turbo 上构建了一个浏览器智能体，任务是在 Hacker News 上给帖子点赞。没有框架时，智能体遇到登录页面就卡住，却谎称成功。他通过添加限制迭代次数、压缩上下文、验证工具调用历史、以及自动处理登录的框架，在不修改提示词的情况下解决了问题。核心观点是：廉价模型配上好框架，比昂贵模型没有框架更有效。

AI产品浏览器智能体 GPT-3.5 Turbo 框架设计自动化智能体

推荐理由：这个案例戳破了「模型越强越好」的迷思，做浏览器自动化或智能体开发的团队值得看看——框架设计比模型选择更关键，低成本也能出好效果。