08:23Simon Willison’s Weblog(博客/媒体)Charles Ye、Jasmine Cui和Dylan Hadfield-Menell的论文发现,LLM在区分角色标签(如<system>、<think>、<assistant>)与用户输入时,更关注文本的书写风格而非实际语义。通过将攻击文本“去风格化”(destyling)改写,使其看起来与特权文本格式不同,平均攻击成功率从61%骤降至10%。该研究表明,当前模型缺乏真正的角色感知,持续提示注入防御仍是难题。论文prompt injection角色混淆LLM安全论文解读推荐理由:这篇论文揭示了一个反直觉的发现:LLM会被文本的风格欺骗,而不是内容。研究者用简单的'去风格化'就能把攻击成功率从61%打到10%,对理解AI安全很有启发。原文
22:42向阳乔木@vista8Knowly 是一款由 Ethan Yang 团队开发的 AI 工具,能够解读 YouTube 视频和 arXiv 论文,效果令人惊艳。其产品交互和解读质量与 Google 的 NotebookLM 不相上下,配套的 Chrome 插件已被谷歌列入精选。目前免费额度较少,向量处理速度稍慢,但整体体验出色。该工具适合需要快速理解视频和学术内容的用户。AI产品AI 产品视频解读论文解读Chrome 插件NotebookLM推荐理由:想快速吃透 YouTube 视频或学术论文的读者,Knowly 是 NotebookLM 之外的好选择,Chrome 插件已被谷歌精选,值得一试。原文