全部 AI 动态 · AI 热点

6月23日

10:39

10:39

arXiv cs.LG@Yuhang Jiang, Xiaojing Chen

这篇论文发现，输入多样性（DI）通过随机调整大小和填充来提升迁移性，但这种假设依赖于替代模型的类型。在标准替代模型上增加DI概率可提高攻击成功率，但在鲁棒训练的替代模型上反而降低，形成剪刀曲线。在ImageNet上，盲目使用DI导致鲁棒源模型在CNN、ViT、Swin和ConvNeXt等目标上的平均攻击成功率下降10.3%。通过梯度几何分析，约67%的伤害来自resize操作，且直接梯度对齐测量证实resize对标准模型有利而对鲁棒模型有害。作者提出一种无需训练的规则CG-DI，在局部梯度一致性高时禁用DI，避免鲁棒替代模型的损失。

论文剪刀效应输入多样性迁移攻击鲁棒性 ImageNet

推荐理由：这篇论文讲了一个反直觉的现象：给攻击加随机缩放，对标准模型有用，对鲁棒模型反而有害。还给出了简单补救方法，搞对抗攻击的可以看看。

6月16日

20:46

AITOP6月16日 20:46

600亿美元买下Cursor，xAI终于拿到了编程工具，但真正值得跟踪的或许不是AI

600亿美元买下Cursor，xAI终于拿到了编程工具，但真正值得跟踪的或许不是AI

11:03

11:03

arXiv cs.LG@Abdul-Rauf Nuhu, Parham M. Kebria, Vahid Hemmati, Mahmoud N. Mahmoud, Edward Tunstel, Abdollah Homaifar

现有深度学习模型泛化误差上界往往过于松散，尤其在0-1损失下。本文提出基于局部鲁棒性与稳定性的新泛化界，通过按输入空间子区域中稳定与不稳定样本数量缩放鲁棒项。在ImageNet数据集上，该界保持非空且比现有方法得到更紧的上界，与多个鲁棒深度神经网络的真实性能紧密对齐。

论文泛化误差鲁棒性 ImageNet 深度学习

推荐理由：这篇论文提出了更紧的深度学习泛化误差上界，在ImageNet上比现有方法更准，值得一看。

6月12日

12:57

AITOP6月12日 12:57

Claude代码里藏了个20260612，18个月后的AI记忆革命已经开始倒计时

09:41

09:41

arXiv cs.LG@Jagriti Singh, Shekhar Verma, Muneendra Ojha

标准分类器引导的扩散模型倾向于生成高密度类均值附近的样本，导致对尾部罕见样本的覆盖不足。现有方法通过训练额外的低密度分类器来解决，但增加了计算成本。本文提出一种纯采样阶段的密度感知方法，无需额外训练，通过修改反向扩散动力学，利用分类器梯度将轨迹引向低置信区域，同时引导采样接近真实数据流形。在ImageNet 64x64分辨率下，该方法一致提升了ADM模型的召回率，同时保持可比的FID分数；在256x256分辨率下，视觉结果显示了不同引导组合的效果。这项工作为生成模型的长尾覆盖问题提供了一种轻量级解决方案。

论文扩散模型分类器引导低密度区域探索长尾覆盖 ImageNet

推荐理由：做生成模型长尾覆盖或罕见样本生成的团队，无需额外训练就能提升模型对低密度区域的探索能力，建议直接参考其采样策略。

6月11日

15:28

AITOP6月11日 15:28

1107 vs 303：谷歌悄悄开源了一个“拆打字机”的模型，把大模型速度翻了4倍

15:23

AITOP6月11日 15:23

DiffusionGemma颠覆文本生成？自回归模型的“统治”要结束了

15:07

AITOP6月11日 15:07

每秒1107个token，Google开源的扩散模型为什么能改变本地推理格局？

5月19日

11:01

11:01

arXiv cs.LG@Grigory Bartosh, David Ruhe, Emiel Hoogeboom, Jonathan Heek, Thomas Mensink, Tim Salimans

精选

Dual-Rate Diffusion 提出了一种新的扩散模型加速方法，通过交错执行一个稀疏更新的重上下文编码器和一个轻量去噪模型来降低推理成本。重编码器每几步提取一次高维特征，轻量模型则在每一步复用这些特征进行高效去噪。在 ImageNet 基准上，该方法在保持生成质量的同时将计算成本降低 2-4 倍。此外，该方法与蒸馏技术（如 Moment Matching Distillation）兼容，可进一步加速少步生成。

论文扩散模型推理加速 ImageNet 蒸馏生成模型

推荐理由：扩散模型推理慢是落地痛点，Dual-Rate Diffusion 用轻量网络复用特征，做图像生成的团队可以直接拿来加速现有模型，效果不打折。