10:36arXiv cs.AI@Anastasiia Kuvshinova, Seungmin Jin精选本文提出Graph Traversal Agent,一种结合LLM推理与确定性图操作的根因分析代理,用于诊断Kubernetes事件。该方法通过类型化证据图、LangGraph状态机和独立验证阶段,确保分析结果可审计且不依赖场景捷径。在ITBench基准测试中,系统在23个场景子集上根因实体F1从0.6087提升至0.9130,但消融实验显示部分提升源于提示词优化,去除提示后F1降至0.6958。研究强调,真正的泛化能力需通过提示消融、级联源检查等轻量级验证来区分。目前工作限于ITBench OpenTelemetry-demo快照,未声称生产就绪。论文Kubernetes根因分析LLM代理图遍历可审计AI推荐理由:Kubernetes运维团队终于有了一个可审计的根因分析方案——Graph Traversal Agent通过图约束和独立验证,避免了LLM常见的幻觉和场景作弊。做K8s可观测性或事件诊断的开发者,值得看看这个结合图遍历与LLM的框架设计。原文
09:59arXiv cs.AI@William Lugoloobi, Samuelle Marro, Jabez Magomere, Joss Wright, Chris Russell精选研究人员发现,基于LLM的浏览器代理在网页上执行任务时,其操作序列和交互时间可以被被动JavaScript追踪器捕获,从而以高达96%的F1分数识别出底层模型。该研究覆盖了14个前沿LLM和四个网页环境,包括信息检索和购物任务。攻击者可以利用此漏洞针对已知模型漏洞发起定向攻击。虽然注入随机时间延迟可以降低分类器性能,但重新训练后仍能恢复大部分识别能力。研究团队已发布相关工具和标注数据集。论文LLM代理安全/隐私指纹识别浏览器自动化模型漏洞推荐理由:这项研究揭示了LLM代理的一个重大安全风险——网站可以被动识别你的AI模型,做AI安全和隐私保护的团队值得关注,建议开发者检查自己的代理是否容易通过UI痕迹被指纹识别。原文