11:08arXiv cs.LG@Floor van Maarschalkerwaart, Subhadip Mukherjee, Christoph Brune, Marcello Carioni该论文提出一种结构化分布鲁棒优化(DRO)框架,在逆问题学习重建中对抗训练与测试噪声分布不匹配的问题。与标准 Wasserstein DRO 对全部联合分布均匀扰动不同,该方法将不确定性集限制在符合测量过程的扰动子集上(如条件分布 P(Y|X)),更真实地建模前向算子与噪声模型。理论推导了强对偶性与显式最坏情况风险界,表明该框架等效于在重建算子 Lipschitz 常数上施加 Tikhonov 正则化。在去模糊和 sinogram-to-CT 重建实验上,该方法相比标准 DRO 和 MSE 基线,在鲁棒性、稳定性和可解释性上均有提升,且在线性设置下学习到的算子呈现低秩结构,可视为截断 SVD 的数据驱动变体。论文分布鲁棒优化逆问题学习重建鲁棒性Tikhonov正则化推荐理由:这篇论文解决了逆问题模型在噪声变化时性能暴跌的痛点,用结构化的 DRO 替代傻均匀扰动,实验还发现它自动学出低秩算子。搞图像重建或鲁棒学习的可以细看。原文
12:51arXiv cs.LG@Ankur Garg, Ulrich Aïvodji, Samira Ebrahimi Kahou, Vincent Michalski神经分类树(NCT)通过树状结构编码子组信息,无需子组标注即可将样本路由到“易”或“难”节点,并重用路径作为伪标签迭代优化。在五个基准(含二分类和多分类虚假关联)上,NCT一致隔离少数子组,解释性强,且鲁棒性与最先进方法相当。论文NCT鲁棒性可解释性子组发现虚假关联推荐理由:这篇论文用树结构搞定模型对少数子组表现差的问题,还能看清子组结构,挺实在的。原文
10:39arXiv cs.LG@Yuhang Jiang, Xiaojing Chen这篇论文发现,输入多样性(DI)通过随机调整大小和填充来提升迁移性,但这种假设依赖于替代模型的类型。在标准替代模型上增加DI概率可提高攻击成功率,但在鲁棒训练的替代模型上反而降低,形成剪刀曲线。在ImageNet上,盲目使用DI导致鲁棒源模型在CNN、ViT、Swin和ConvNeXt等目标上的平均攻击成功率下降10.3%。通过梯度几何分析,约67%的伤害来自resize操作,且直接梯度对齐测量证实resize对标准模型有利而对鲁棒模型有害。作者提出一种无需训练的规则CG-DI,在局部梯度一致性高时禁用DI,避免鲁棒替代模型的损失。论文剪刀效应输入多样性迁移攻击鲁棒性ImageNet推荐理由:这篇论文讲了一个反直觉的现象:给攻击加随机缩放,对标准模型有用,对鲁棒模型反而有害。还给出了简单补救方法,搞对抗攻击的可以看看。原文
06:39OpenAI@OpenAI精选OpenAI发布测试结果,评估模型对齐在压力下的表现。在对抗性提示下,模型更难被引导至有害行为,同时依然能响应有益指令。初步证据表明,模型对有害微调也表现出更强的抵抗力。这项测试关注模型的安全鲁棒性,未提及具体模型版本或基准分数。AI模型OpenAI对齐对抗性提示有害微调鲁棒性10 个信源在谈推荐理由:OpenAI发现他们的模型在对抗压力下挺得住,不容易被带坏,安全对齐效果不错。原文
09:41arXiv cs.AI@Andrea Santomauro, Luigi Portinale, Giorgio Leonardi本研究从理论和实验两方面分析了相似性位置编码(simPE)在旋转扰动下的鲁棒性。论文首先证明simPE通常不具备旋转不变性,但基于Lipschitz假设推导出其在Frobenius范数下的显式扰动界。实验在四个数据集(Arrow、Shapes、Digits、FashionMNIST)上进行,测试图像逐渐增大旋转角度,simPE在准确率、F1、精确率和召回率上均优于标准学习型位置编码,尤其在小到中等旋转角度下表现更优。论文simPE位置编码鲁棒性旋转不变性Transformer推荐理由:这篇论文证明了simPE在图像旋转下比标准位置编码更稳,用四个数据集给出了理论界和实验验证,做视觉Transformer的值得看。原文
11:03arXiv cs.LG@Abdul-Rauf Nuhu, Parham M. Kebria, Vahid Hemmati, Mahmoud N. Mahmoud, Edward Tunstel, Abdollah Homaifar现有深度学习模型泛化误差上界往往过于松散,尤其在0-1损失下。本文提出基于局部鲁棒性与稳定性的新泛化界,通过按输入空间子区域中稳定与不稳定样本数量缩放鲁棒项。在ImageNet数据集上,该界保持非空且比现有方法得到更紧的上界,与多个鲁棒深度神经网络的真实性能紧密对齐。论文泛化误差鲁棒性ImageNet深度学习推荐理由:这篇论文提出了更紧的深度学习泛化误差上界,在ImageNet上比现有方法更准,值得一看。原文
11:02arXiv cs.AI@Tianyu Ruan, Fengzhuo Zhang, Shuche Wang, Shihua Zhang精选72°Muon 作为预训练大语言模型和视觉分类器的新兴优化器,其效率优势已超过 Adam 和 SGD,但特征学习优势尚不明确。本文通过鲁棒性和迁移性视角研究 Muon 的特征学习优势:在损坏图像和文本上评估预训练模型,发现 Muon 学到的特征比 Adam 和 SGD 更鲁棒,且这种优势体现在更大的 logit 边际上。通过下游任务的线性分类器或微调,Muon 的特征迁移效果更好,这得益于隐藏状态的有效秩更高。在含多组件的分类问题中,论文从理论上证明了 Muon 能获得更大边际和更高有效秩。论文Muon优化器鲁棒性迁移学习特征学习推荐理由:Muon 优化器在鲁棒性和迁移性上全面超越 Adam,做预训练或迁移学习的团队值得关注,尤其是需要模型对噪声和下游任务更鲁棒的场景。原文
09:16arXiv cs.AI@Eloy Geenjaar, Vince Calhoun, Scott Daly, Gouthaman KV, Lie Lu, Trisha Mittal, Daniel P. Darcy该研究提出了一种利用多模态生理信号监督的PPG基础模型,无需高质量或现场类预训练数据,而是借助ICU数据集中的心电和呼吸信号来选择对比学习样本。模型在预训练时能保留并学习噪声PPG片段,从而提升推理时的鲁棒性。与现有最先进方法相比,该模型仅用1/3的受试者进行预训练,在15个下游任务中的14个上取得性能提升,包括日常活动和心率预测。结果表明,多模态监督能整合互补生理信息,增强PPG基础模型对消费级数据的泛化能力。论文PPG基础模型多模态监督对比学习鲁棒性可穿戴设备推荐理由:做可穿戴健康监测或临床PPG分析的团队,可以关注这个用更少数据训练出更强鲁棒性的方法,直接提升在真实场景中的表现。原文
10:33arXiv: DeepSeek@Malia Barker, Bishal Lakha, Edoardo Serra, Francesco Gullo研究者提出了一种自动算法,通过生成数值重映射攻击来测试大语言模型在算术推理中的泛化能力。该方法自动推导问题的符号表示,生成约束数值映射并重新计算答案,通过确定性编辑实现问题变换。在GSM8K、MAWPS和MultiArith数据集上测试DeepSeek-R1、Gemma4和GPT-OSS模型,发现GSM8K上条件准确率下降12.16至25.82个百分点,而MAWPS和MultiArith更稳定。结果表明数值重映射鲁棒性强烈依赖于数据集结构,GSM8K即使保留推理程序仍敏感,而较短更规则的数据集更鲁棒。论文LLM算术推理鲁棒性数值重映射GSM8K1 个信源在谈推荐理由:做LLM评估和推理优化的团队会关心——GSM8K的脆弱性说明基准测试可能高估了模型的真实推理能力,建议关注数值变化对模型泛化的影响。原文
10:59arXiv cs.AI@Vishal Rajput精选本文提出“匹配原则”,将鲁棒性、域适应、光度不变性、组合泛化、时间鲁棒性、对齐安全等看似独立的问题统一为同一个统计问题:估计部署干扰的协方差,然后沿着覆盖该协方差的矩阵正则化编码器雅可比矩阵。在线性高斯模型中,作者证明了闭式最优性(定理A),包括匹配范围内的立方根水填充;证明了二次雅可比惩罚需要范围覆盖(定理G);并提供了七个条件一致性引理。作者引入轨迹偏差指数(TDI),一种无标签的嵌入敏感性探针。在从经典ML到Qwen2.5-7B的13个预注册实验中,12个通过了预测的匹配-各向同性-错误W顺序测试。在7B规模上,匹配风格PMH提高了选择性诚实性,并保持了风格TDI,而标准DPO则使其退化。论文表示学习鲁棒性域适应正则化匹配原则推荐理由:这篇论文把鲁棒性、域适应等一堆看似无关的问题统一成了一个统计框架,做表示学习或模型泛化的研究者可以直接用匹配原则指导正则化器设计,省去试错成本。原文
10:22arXiv cs.LG@Donggyu Lee, Taekyung Lee, Jaewoong Choi精选UOTIP 提出了一种基于非平衡最优传输(UOT)的新方法,用于解决无配对图像逆问题。该方法通过引入基于似然的代价函数,学习从噪声测量分布到干净信号分布的传输映射,无需配对训练数据。UOT 框架通过放松精确边际约束,使模型对多级观测噪声、类别不平衡和多种噪声类型具有鲁棒性。理论分析表明,加入二次代价项可确保传输映射的存在性和唯一性。实验结果显示,UOTIP 在线性和非线性逆问题基准上均达到最先进性能。论文图像逆问题最优传输无配对学习鲁棒性UOTIP推荐理由:无配对图像逆问题是实际应用中的常见难题,UOTIP 用非平衡最优传输优雅地解决了数据不配对和噪声鲁棒性问题,做医学成像或遥感图像恢复的团队值得关注。原文
09:46arXiv cs.AI@Alexi Canesse, Benoît Goupil, Jesse Read, Sonia Vanier精选多智能体强化学习(MARL)中,通信是实现协作的关键,但许多实际应用(如无人机群搜索救援)面临严重的带宽限制。现有通信架构通常将共享潜在表示同时用于策略执行和智能体间通信,导致减少消息大小会直接限制策略的潜在空间,造成性能显著下降。本文提出两个贡献:一是引入归一化的每智能体带宽预算 β,统一了稀疏性、轮次和消息维度;二是提出 SLIM 架构,将通信路径与策略的潜在表示解耦,从而隔离带宽对策略容量的影响。实验表明,SLIM 在多个部分可观测的 MARL 基准上达到最先进性能,并在带宽减少时仅出现轻微性能下降,展现出良好的可扩展性和鲁棒性。论文多智能体强化学习带宽约束通信解耦SLIM鲁棒性推荐理由:做多智能体系统或机器人集群的团队,终于有了一个能直接应对带宽瓶颈的架构——SLIM 解耦通信与策略,带宽砍半性能也不崩,值得在无人机或边缘设备场景里试试。原文
14:53arXiv cs.LG@Mohamed elShehaby, Ashraf Matrawy精选本文研究了在基于梯度的对抗攻击下,仅通过精心选择网络架构(如更浅的网络、更少的特征和ReLU激活函数)能否使基于深度神经网络的入侵检测系统(NIDS)具备内在鲁棒性。通过约2200次实验,对比FGSM、PGD和BIM攻击,发现浅层网络、简化特征集和ReLU激活函数能显著降低对抗脆弱性。这种简单模型甚至优于经过对抗训练的深层全特征模型,同时保持近乎完美的正常流量检测率和更短的训练时间。研究强调,关键在于选择“正确的少”而非盲目简化。论文对抗攻击入侵检测系统网络架构鲁棒性ReLU推荐理由:做网络安全和ML-NIDS的团队,不用加额外防御就能提升模型抗攻击能力——调整架构本身就能见效,值得在现有系统上试试这个“少即是多”的思路。原文
11:15arXiv cs.LG@Lanxin Xiang, Liang Shi, Youhui Ye, Boyu Jiang, Dawei Zhou, Feng Guo精选特征归因分析在解释机器学习模型时,常因数据分割、随机种子等随机因素导致结果不稳定。本文提出 RoSHAP 框架,通过 Bootstrap 重采样和核密度估计建模特征重要性得分的分布,并证明聚合得分渐近服从高斯分布,大幅降低计算成本。RoSHAP 指标同时奖励活跃、强且稳定的特征,在模拟和真实实验中优于单次归因方法。使用 RoSHAP 筛选的特征构建的模型,在预测性能接近全特征模型的同时,显著减少了特征数量。该框架提升了模型的可解释性和稳定性,为可靠的数据驱动决策提供了支持。论文特征归因SHAP鲁棒性模型可解释性Bootstrap推荐理由:做模型可解释性研究的团队终于有了一个能对抗随机波动的归因指标——RoSHAP 通过分布建模让特征排序更稳定,做特征筛选和模型审计的开发者可以直接用。原文
19:12arXiv: DeepSeek@Wenyong Zhou, Yuannuo Feng, Yizhe Chen, Taiqiang Wu, Wendong Xu, Wenbo Qi, Zhengwu Liu, Wang Kang, Ngai Wong精选混合专家(MoE)大模型通过稀疏激活专家实现高效扩展,但频繁切换专家造成内存带宽瓶颈,而模拟存算一体(CIM)架构可缓解此问题。然而,模拟CIM的硬件缺陷会扰动存储权重,其对MoE模型的影响此前未被系统研究。本文首次基于真实芯片噪声校准,发现硬件噪声会破坏专家负载均衡,使训练好的路由决策失效。为此提出ROMER后训练校准框架:替换低激活专家为高频专家以恢复负载均衡,并通过百分位数归一化重新校准路由器logits。在DeepSeek-MoE、Qwen-MoE和OLMoE上,ROMER在真实芯片噪声下将困惑度分别降低58.6%、58.8%和59.8%,验证了其有效性和跨架构泛化能力。论文MoE存算一体硬件噪声后训练校准鲁棒性推荐理由:模拟存算一体是突破大模型内存墙的关键路线,但硬件噪声对MoE架构的破坏一直未被正视。做硬件-算法协同设计的团队,这篇论文给出了可直接复用的校准方案,值得细读。原文