10:43arXiv cs.LG@Seth Dobrin, Łukasz Chmiel该论文提出Unfireable Safety Kernel,一种执行时AI对齐机制,满足四个属性:进程隔离、结构唯一路径预执行、请求和系统级故障关闭、外部可验证签名证据。Rust参考实现通过Z3定理证明和Kani模型检查(4/4 harnesses)机器验证了故障关闭不变性。在可逃逸AI系统上测试,面对逃逸攻击者,1000次自我修改中所有704次对安全核心的尝试被拒绝,无逃逸;6240次授权往返无成功绕过。相比3个声称控制智能体平面的当代系统,该内核使智能体失去控制选项。论文Unfireable Safety KernelAI Agent安全对齐形式验证Rust推荐理由:这篇论文用Rust和形式化验证搞了个安全内核,1000次自修改加6240次授权测试都拦住了逃逸,比那些吹控制智能体的系统实在多了。原文
11:31arXiv cs.AI@Alaia Solko-Breslin, Pramod Kaushik Mudrakarta, Mihai Christodorescu, Somesh Jha, Krishnamurthy Dj Dvijotham论文提出基于分布鲁棒优化(DRO)的框架,用于AI Agent在不确定性下的策略违反概率验证。该方法支持包含概率谓词或状态转换的Datalog策略,无需假设谓词间独立性。在终端和工具调用Agent标准基准上,计算出的概率上界比先前方法更紧,同时保证了安全与效用的权衡。实验表明,该方法在多个测试集上提升了安全策略的合规性。论文AI Agent概率验证Datalog分布鲁棒优化安全策略推荐理由:这篇论文给AI Agent加了一道安全锁:用分布鲁棒优化算清楚策略违规的概率上限,比旧方法更准、更高效。原文
10:35arXiv: OpenAI@Dipayan Banik, Kowshik Chowdhury, Shazibul Islam Shamim该论文分析了33,596个AI Agent(OpenAI Codex、GitHub Copilot、Devin、Cursor、Claude Code)提交的86,156个测试文件补丁,发现80.2%的测试补丁包含弱或没有显式断言(oracle signals)。研究者总结出8种oracle信号类型,并发现经过回归分析调整后,强oracle信号使PR合并可能性提高28%(OR=1.28, p<0.001)。结果表明仅凭测试文件数量会高估验证强度。论文AI Agent测试代码断言代码质量实证研究10 个信源在谈推荐理由:这篇论文用86k条实际数据告诉你:AI写的测试代码虽然多,但八成没用断言,光靠数量验收会翻车。建议读读他们总结的oracle信号分类。原文
10:30arXiv: DeepSeek@Jasmine Brazilek, Oliver Tulio, Joel Christoph, Miles Tidmarsh, Carol Kline, Arturs Kanepajs新基准TAC(Travel Agent Compassion)测试AI代理在12个旅行预订场景中是否避免动物剥削选项,涵盖6类动物剥削,扩展至48个样本以控制价格、评分和位置干扰。7个前沿模型得分均低于64%的随机水平,最佳Claude Opus 4.7为53%。在系统提示中加入一句福利意识语句后,Claude和GPT-5.5提升47-63个百分点,GPT-5.2提升26个百分点,DeepSeek和Gemini提升不到12个百分点。对前两名模型的288条基底记录审计未发现评估意识,表明低分并非因识别出测试。论文TAC动物福利AI Agent基准测试Claude Opus 4.71 个信源在谈推荐理由:动物福利问题有了AI专属的代理基准TAC,实测Claude Opus 4.7刚过一半,加个提示词能暴增60%,暴露了模型在实际行动中的盲区。原文
10:10arXiv cs.AI@Jeremy Yang, Kate Zyskowski, Noah Yonack, Jerry Ma83°这篇论文基于 Perplexity 的 Search 和 Computer 产品的实际使用数据,研究了 AI Agent 如何改变知识工作。研究发现,Computer 产品(具有自主执行能力)每个用户会话可自动完成 26 分钟的工作,而 Search 仅为 33 秒。在相同任务上,Computer 将完成时间从 269 分钟降至 36 分钟,成本降低 94%,且用户不满率降低 55%。此外,Computer 用户更倾向于尝试跨职业边界、需要高阶认知的复合任务,解锁了 Search 中几乎不存在的活动。这表明 AI Agent 不仅加速了工作流,还提升了质量、降低了成本,并扩展了自动化工作的广度和深度。论文AI Agent知识工作自主性效率提升Perplexity推荐理由:这篇论文用真实数据证明了 AI Agent 在知识工作中的巨大价值——效率提升 7 倍、成本降低 94%,做 AI 产品设计或知识管理的人值得仔细看,尤其是 Perplexity 的案例很有参考意义。原文
12:01arXiv cs.AI@Zhuoming Chen, Xinrui Zhong, Qilong Feng, Ranajoy Sadhukhan, Yang Zhou, Michael Qizhe Shieh, Zhihao Jia, Beidi Chen精选Vortex 是一个专为大规模语言模型(LLM)设计的稀疏注意力服务系统,解决了稀疏注意力算法在部署和评估中工程成本高的问题。它通过 Python 嵌入式前端语言和页面中心张量抽象,支持广泛稀疏注意力算法的快速原型设计、部署和评估。在 NVIDIA B200 GPU 上,Vortex 使 AI Agent 自动生成的算法吞吐量比全注意力提升高达 3.46 倍,并在 MLA 架构的 GLM-4.7-Flash 和 229B 参数的 MiniMax-M2.7 上分别实现 4.7 倍和 1.37 倍的吞吐量提升。该系统显著加速了稀疏注意力算法的迭代,尤其适用于长序列生成场景。论文稀疏注意力LLM服务AI Agent吞吐量优化Vortex8 个信源在谈推荐理由:稀疏注意力是长上下文 LLM 服务的关键瓶颈,Vortex 让 AI Agent 和研究者能快速实验新算法,做 LLM 推理优化的团队可以直接用它提升吞吐量,值得关注。原文