全部 AI 动态 · AI 热点

6月30日

11:08

arXiv cs.LG@Floor van Maarschalkerwaart, Subhadip Mukherjee, Christoph Brune, Marcello Carioni

该论文提出一种结构化分布鲁棒优化（DRO）框架，在逆问题学习重建中对抗训练与测试噪声分布不匹配的问题。与标准 Wasserstein DRO 对全部联合分布均匀扰动不同，该方法将不确定性集限制在符合测量过程的扰动子集上（如条件分布 P(Y|X)），更真实地建模前向算子与噪声模型。理论推导了强对偶性与显式最坏情况风险界，表明该框架等效于在重建算子 Lipschitz 常数上施加 Tikhonov 正则化。在去模糊和 sinogram-to-CT 重建实验上，该方法相比标准 DRO 和 MSE 基线，在鲁棒性、稳定性和可解释性上均有提升，且在线性设置下学习到的算子呈现低秩结构，可视为截断 SVD 的数据驱动变体。

论文分布鲁棒优化逆问题学习重建鲁棒性 Tikhonov正则化

推荐理由：这篇论文解决了逆问题模型在噪声变化时性能暴跌的痛点，用结构化的 DRO 替代傻均匀扰动，实验还发现它自动学出低秩算子。搞图像重建或鲁棒学习的可以细看。

原文

6月23日

12:51

arXiv cs.LG@Ankur Garg, Ulrich Aïvodji, Samira Ebrahimi Kahou, Vincent Michalski

神经分类树(NCT)通过树状结构编码子组信息，无需子组标注即可将样本路由到“易”或“难”节点，并重用路径作为伪标签迭代优化。在五个基准（含二分类和多分类虚假关联）上，NCT一致隔离少数子组，解释性强，且鲁棒性与最先进方法相当。

论文 NCT 鲁棒性可解释性子组发现虚假关联

推荐理由：这篇论文用树结构搞定模型对少数子组表现差的问题，还能看清子组结构，挺实在的。

原文

10:39

arXiv cs.LG@Yuhang Jiang, Xiaojing Chen

这篇论文发现，输入多样性（DI）通过随机调整大小和填充来提升迁移性，但这种假设依赖于替代模型的类型。在标准替代模型上增加DI概率可提高攻击成功率，但在鲁棒训练的替代模型上反而降低，形成剪刀曲线。在ImageNet上，盲目使用DI导致鲁棒源模型在CNN、ViT、Swin和ConvNeXt等目标上的平均攻击成功率下降10.3%。通过梯度几何分析，约67%的伤害来自resize操作，且直接梯度对齐测量证实resize对标准模型有利而对鲁棒模型有害。作者提出一种无需训练的规则CG-DI，在局部梯度一致性高时禁用DI，避免鲁棒替代模型的损失。

论文剪刀效应输入多样性迁移攻击鲁棒性 ImageNet

推荐理由：这篇论文讲了一个反直觉的现象：给攻击加随机缩放，对标准模型有用，对鲁棒模型反而有害。还给出了简单补救方法，搞对抗攻击的可以看看。

原文

6月19日

06:39

OpenAI@OpenAI

精选

OpenAI发布测试结果，评估模型对齐在压力下的表现。在对抗性提示下，模型更难被引导至有害行为，同时依然能响应有益指令。初步证据表明，模型对有害微调也表现出更强的抵抗力。这项测试关注模型的安全鲁棒性，未提及具体模型版本或基准分数。

AI模型 OpenAI 对齐对抗性提示有害微调鲁棒性

推荐理由：OpenAI发现他们的模型在对抗压力下挺得住，不容易被带坏，安全对齐效果不错。

原文

6月17日

09:41

arXiv cs.AI@Andrea Santomauro, Luigi Portinale, Giorgio Leonardi

本研究从理论和实验两方面分析了相似性位置编码（simPE）在旋转扰动下的鲁棒性。论文首先证明simPE通常不具备旋转不变性，但基于Lipschitz假设推导出其在Frobenius范数下的显式扰动界。实验在四个数据集（Arrow、Shapes、Digits、FashionMNIST）上进行，测试图像逐渐增大旋转角度，simPE在准确率、F1、精确率和召回率上均优于标准学习型位置编码，尤其在小到中等旋转角度下表现更优。

论文 simPE 位置编码鲁棒性旋转不变性 Transformer

推荐理由：这篇论文证明了simPE在图像旋转下比标准位置编码更稳，用四个数据集给出了理论界和实验验证，做视觉Transformer的值得看。

原文

6月16日

20:46

AITOP6月16日 20:46

600亿美元买下Cursor，xAI终于拿到了编程工具，但真正值得跟踪的或许不是AI

11:03

arXiv cs.LG@Abdul-Rauf Nuhu, Parham M. Kebria, Vahid Hemmati, Mahmoud N. Mahmoud, Edward Tunstel, Abdollah Homaifar

现有深度学习模型泛化误差上界往往过于松散，尤其在0-1损失下。本文提出基于局部鲁棒性与稳定性的新泛化界，通过按输入空间子区域中稳定与不稳定样本数量缩放鲁棒项。在ImageNet数据集上，该界保持非空且比现有方法得到更紧的上界，与多个鲁棒深度神经网络的真实性能紧密对齐。

论文泛化误差鲁棒性 ImageNet 深度学习

推荐理由：这篇论文提出了更紧的深度学习泛化误差上界，在ImageNet上比现有方法更准，值得一看。

原文

6月12日