全部 AI 动态 · AI 热点

6月16日

20:46

AITOP6月16日 20:46

600亿美元买下Cursor，xAI终于拿到了编程工具，但真正值得跟踪的或许不是AI

600亿美元买下Cursor，xAI终于拿到了编程工具，但真正值得跟踪的或许不是AI

6月12日

12:57

AITOP6月12日 12:57

Claude代码里藏了个20260612，18个月后的AI记忆革命已经开始倒计时

09:22

09:22

arXiv cs.AI@Jianming Ma, Qiyue Yang, Yang Zhang, Liyun Yan, Zhanxiang Cao, Yazhou Zhang, Yue Gao

PolyFlow 提出了一种新的约束流匹配框架，专门解决在安全关键物理系统中部署生成模型时的约束问题。传统方法通过事后修正来保证安全性，但计算开销大且可能扭曲数据分布。PolyFlow 将约束直接嵌入模型和流动力学中，采用离散时间流公式和无投影架构，无需昂贵的迭代求解器即可严格满足任意多面体约束。实验表明，PolyFlow 在规划和控制任务中实现零约束违规，同时保持高分布保真度，推理延迟显著低于现有方法。代码已开源，适合需要安全生成的应用场景。

论文约束生成流匹配安全关键系统无投影更新开源/仓库

推荐理由：做安全关键系统（如机器人规划、控制）的团队终于有了一个既能严格满足约束又不牺牲生成质量的方案，PolyFlow 的零违规和低延迟特性值得直接试试。

6月11日

15:28

AITOP6月11日 15:28

1107 vs 303：谷歌悄悄开源了一个“拆打字机”的模型，把大模型速度翻了4倍

15:23

AITOP6月11日 15:23

DiffusionGemma颠覆文本生成？自回归模型的“统治”要结束了

15:07

AITOP6月11日 15:07

每秒1107个token，Google开源的扩散模型为什么能改变本地推理格局？

6月9日

12:28

12:28

arXiv cs.LG@Sherwin Varghese, Matthew Wicker, Alessio Lomuscio

精选

随着AI在安全关键系统中的部署，形式化鲁棒性保证变得至关重要。现有验证方法要么过于保守，要么计算成本高昂。本文提出STBP（时空边界传播）框架，针对处理视频和体积输入的3D CNN，通过建模真实的时空约束（如攻击者只能修改连续帧中的子集或补丁）来获得更紧的近似。STBP对第一卷积层计算精确闭式解，后续层使用可扩展近似，在UCF-101、Udacity和MedMNIST等基准上实现了1.7倍更高的认证鲁棒准确率。同时，作者发布了ST-Bench基准，用于系统评估自动驾驶和活动识别中的可验证鲁棒性。

论文鲁棒性验证时空神经网络 3D CNN 形式化验证安全关键系统

推荐理由：做AI安全验证的团队终于有了兼顾精度和效率的方案——STBP用混合策略解决了传统方法要么太松要么太慢的困境，做视频/3D视觉鲁棒性验证的开发者可以直接参考。

5月14日

13:27

13:27

arXiv cs.AI@Bethel Hall, William Eiers

精选

该研究提出一种神经符号方法，结合大语言模型与SMT求解器，用于审计自然语言编写的软件需求。通过将需求翻译为形式逻辑，利用随机变化检测歧义，并通过求解器查询暴露不一致、空洞和安全违规。在医疗设备软件需求上验证的VERIMED管道显示，独立形式化之间的随机变化是歧义的信号，而具体SMT反例可将验证准确率从55.4%提升至98.5%。该方法为安全关键领域的需求审计提供了可扩展的自动化方案。

论文神经符号方法 SMT求解器需求审计安全关键系统 VERIMED

推荐理由：安全关键软件团队终于有了自动审计自然语言需求的实用工具——VERIMED用LLM+SMT组合把歧义、不一致和安全漏洞揪出来，做医疗、航空等领域的需求工程师可以直接关注。