11:08arXiv cs.LG@Jun He, Deying Yu论文提出 Sovereign Execution Broker (SEB),一种运行时执行边界,用于证书绑定的自主基础设施。SEB 消耗由 Sovereign Assurance Boundary (SAB) 签发的证书,验证请求变更是否匹配认证执行契约,检查有效期窗口、策略纪元、撤销纪元和实时状态漂移。SEB 铸造作用域执行身份,调用基础设施 API,记录签名决策和结果记录。原型在 AWS 和 Kubernetes 集群上评估,测量延迟开销、撤销传播、漂移检测和故障注入下的安全性。论文Sovereign Execution Broker自主代理证书绑定执行边界安全推荐理由:想给自主代理加一把安全锁?这篇论文提出了SEB,一个在运行时强制证书绑定的执行边界,能控制突变操作。实测在AWS和K8s上延迟开销可控。原文
11:08arXiv cs.LG@Gilad Gressel, Rahul Pankajakshan, Julia Diament, Efim Hudis, Krishnashree Achuthan, Yisroel Mirsky精选随着LLM被部署为智能体,可靠监控需要知道不仅输出内容,还有哪些指令在引导其行为。当模型推断意外子目标、遵循上下文线索或受提示注入和隐藏目标影响时,这变得困难。现有激活到语言方法无法恢复智能体场景中同时活跃的完整指令集、约束、禁止和子目标。PRISM是一个激活条件解释器,从冻结目标模型的隐藏状态解码出忠实的活动指令要点列表。它使用法官引导的GRPO训练,奖励覆盖的指令并惩罚无支持的指令,在良性、约束、提示注入和隐藏目标设置中优于基线方法,尤其在安全相关目标上表现突出。论文指令恢复激活解释智能体监控安全LLM推荐理由:PRISM解决了LLM智能体监控中指令恢复的盲区,对安全团队和AI治理开发者来说,这是直接可用的工具,建议关注其在实际部署中的效果。原文
10:41arXiv cs.AI@Maksuda Bilkis Baby, Khushika Shah, Naiyue Liang, Lei Zhang精选针对公开代码仓库中凭据泄露检测高误报率问题,研究者提出一个三类分类框架,将占位符/弱凭据作为独立类别,结合CodeBERT语义理解与字符级模式识别。在包含10种编程语言的9426个样本数据集上,模型在真实凭据泄露检测上达到93%召回率和89%精确率,同时将高严重性告警减少33%。相比纯字符级方法,占位符/弱凭据检测F1从54%提升至81%,且跨语言泛化能力强,9/10语言在留一语言评估中F1超过0.80。论文凭据泄露检测CodeBERTCNN安全开源仓库推荐理由:安全团队终于有了能区分真实凭据和占位符的检测工具,误报率大幅降低。做DevSecOps的开发者可以直接参考这个框架来优化自己的凭据扫描流程。原文
11:15arXiv cs.AI@Mohamed Almukhtar, Anwar Ghammam, Hua Ming精选一项针对 AI 代理生成的 Python 重构 Pull Request 的实证研究发现,平均 22.5% 的变更提升了代码质量属性,其中可用性提升最频繁(36.5%)。但 24.17% 的修改文件引入了新的 Pylint 问题(主要是约定违规如长行),4.7% 引入了新的 Bandit 安全发现。尽管存在这些问题,73.5% 的 PR 被合并,包括那些引入新问题但同时也移除了旧问题的案例。研究还归纳了 24 种常见变更操作及其与 lint/安全发现的关系,强调了在 AI 驱动开发中加强质量与安全门控的必要性。论文AI 编程代码质量安全重构Python推荐理由:AI 写代码到底靠不靠谱?这篇论文用数据说话——重构 PR 质量有提升也有隐患,做 AI 编程工具或代码审查的团队值得看看,能帮你设计更好的质量门控。原文
09:54arXiv cs.AI@Nicanor Mayumu, Xiaoheng Deng, Patrick Mukala精选该研究首次系统评估了视觉-语言-动作(VLA)驾驶模型在推理忠实性方面的表现,分析了 Alpamayo-R1-10B 在 100 个场景中的 300 次推理。结果显示,模型输出的自然语言推理与轨迹存在显著不忠实:整体推理忠实度仅 42.5%,Chain-of-Causation 匹配场景现实不到一半;在三分之一的行人相关场景中遗漏了 94 个行人;轻微视觉扰动导致 97.7% 的轨迹脆弱;推理-动作一致性仅 48.3%,其中 53.3% 的推理一致性低,37.9% 声称停止但模型继续前进。研究从信息论角度形式化了忠实性,定义了实体和动作忠实性验证标准,并提出了四组件安全架构。论文VLA自动驾驶推理忠实性安全Chain-of-Causation推荐理由:VLA 驾驶模型的推理不忠实问题直接关系到自动驾驶安全,做自动驾驶或具身智能的开发者值得关注——你的模型可能声称停车但实际在开。原文