09:22arXiv cs.AI@Jianming Ma, Qiyue Yang, Yang Zhang, Liyun Yan, Zhanxiang Cao, Yazhou Zhang, Yue GaoPolyFlow 提出了一种新的约束流匹配框架,专门解决在安全关键物理系统中部署生成模型时的约束问题。传统方法通过事后修正来保证安全性,但计算开销大且可能扭曲数据分布。PolyFlow 将约束直接嵌入模型和流动力学中,采用离散时间流公式和无投影架构,无需昂贵的迭代求解器即可严格满足任意多面体约束。实验表明,PolyFlow 在规划和控制任务中实现零约束违规,同时保持高分布保真度,推理延迟显著低于现有方法。代码已开源,适合需要安全生成的应用场景。论文约束生成流匹配安全关键系统无投影更新开源/仓库推荐理由:做安全关键系统(如机器人规划、控制)的团队终于有了一个既能严格满足约束又不牺牲生成质量的方案,PolyFlow 的零违规和低延迟特性值得直接试试。原文
12:28arXiv cs.LG@Sherwin Varghese, Matthew Wicker, Alessio Lomuscio精选随着AI在安全关键系统中的部署,形式化鲁棒性保证变得至关重要。现有验证方法要么过于保守,要么计算成本高昂。本文提出STBP(时空边界传播)框架,针对处理视频和体积输入的3D CNN,通过建模真实的时空约束(如攻击者只能修改连续帧中的子集或补丁)来获得更紧的近似。STBP对第一卷积层计算精确闭式解,后续层使用可扩展近似,在UCF-101、Udacity和MedMNIST等基准上实现了1.7倍更高的认证鲁棒准确率。同时,作者发布了ST-Bench基准,用于系统评估自动驾驶和活动识别中的可验证鲁棒性。论文鲁棒性验证时空神经网络3D CNN形式化验证安全关键系统推荐理由:做AI安全验证的团队终于有了兼顾精度和效率的方案——STBP用混合策略解决了传统方法要么太松要么太慢的困境,做视频/3D视觉鲁棒性验证的开发者可以直接参考。原文
13:27arXiv cs.AI@Bethel Hall, William Eiers精选该研究提出一种神经符号方法,结合大语言模型与SMT求解器,用于审计自然语言编写的软件需求。通过将需求翻译为形式逻辑,利用随机变化检测歧义,并通过求解器查询暴露不一致、空洞和安全违规。在医疗设备软件需求上验证的VERIMED管道显示,独立形式化之间的随机变化是歧义的信号,而具体SMT反例可将验证准确率从55.4%提升至98.5%。该方法为安全关键领域的需求审计提供了可扩展的自动化方案。论文神经符号方法SMT求解器需求审计安全关键系统VERIMED推荐理由:安全关键软件团队终于有了自动审计自然语言需求的实用工具——VERIMED用LLM+SMT组合把歧义、不一致和安全漏洞揪出来,做医疗、航空等领域的需求工程师可以直接关注。原文