全部 AI 动态 · AI 热点

6月23日

10:41

10:41

arXiv cs.LG@Lei Li, Yuexiao Dong

研究者提出用f-散度诱导的非线性变换替换扩散模型的标准MSE去噪损失，在CIFAR-10数据集30%污染条件下，负指数散度(NED)将FID从93.0（KL散度）降至77.5。该方法基于局部散度构造，利用DDPM高斯反向核结构将每步条件f-散度简化为去噪误差的一维函数。Hellinger散度产生显式指数权重，连接至稳健M估计框架。实验显示NED优于Huber损失和截断MSE等常见鲁棒损失。

论文扩散模型 f-散度 CIFAR-10 FID 稳健训练

推荐理由：这篇论文改进了扩散模型的抗污染能力，用f-散度加权去噪在CIFAR-10上30%污染时FID从93降到77，比常用鲁棒损失好用。

6月18日

10:29

10:29

arXiv cs.LG@Alexandre Lemire Paquin, Brahim Chaib-Draa, Philippe Giguère

本文研究利用平滑损失函数对PAC-Bayes界进行去随机化，以获得确定性预测器的高概率泛化界。通过后验均值从Gibbs预测器到确定性预测器的代价由Jensen gap类的泛化差距给出，并通过Rademacher复杂度控制。得到的界涉及参数Jacobian和得分映射Hessian表示的平坦度量，适用于有界和无界平滑损失，并特例化为线性预测器和平滑神经网络。理论中的Jacobian和Hessian量启发了一个实用的正则化器，对BatchNorm网络在CIFAR-10上进行了不同批量大小下的实验。

论文 PAC-Bayes 泛化界正则化器 Jacobian CIFAR-10

推荐理由：这篇论文从PAC-Bayes理论推导出一个基于Jacobian和Hessian的新正则化器，在CIFAR-10上验证有效，值得搞泛化理论的人看看。

6月16日

20:46

AITOP6月16日 20:46

600亿美元买下Cursor，xAI终于拿到了编程工具，但真正值得跟踪的或许不是AI

600亿美元买下Cursor，xAI终于拿到了编程工具，但真正值得跟踪的或许不是AI

09:51

09:51

arXiv cs.LG@Zhenyu Yu

InstantForget是一种新的后门遗忘方法，无需更新模型参数即可在推理时移除恶意触发行为。在CIFAR-10 ResNet-18上，它针对BadNets、WaNet、Blended和SIG四种触发方式，将平均攻击成功率（ASR）降至0.071。该方法通过马氏距离标记异常特征并重置为中性表示，达到0.981的检测AUROC，并成功迁移至六种主干网络。论文还揭示了投影假设在WaNet等触发下的失效（ASR分别达0.683、0.888和0.941），并用logit-trilplet间隙预测失败。

论文 InstantForget 后门攻击模型安全 CIFAR-10 推理时

推荐理由：这篇论文提出InstantForget，不用重新训练就能清除模型后门，在CIFAR-10上把攻击成功率压到7%，还搞了个检测机制AUROC 98%，挺实用的。

6月12日

12:57

AITOP6月12日 12:57

Claude代码里藏了个20260612，18个月后的AI记忆革命已经开始倒计时

6月11日

15:28

AITOP6月11日 15:28

1107 vs 303：谷歌悄悄开源了一个“拆打字机”的模型，把大模型速度翻了4倍

15:23

AITOP6月11日 15:23

DiffusionGemma颠覆文本生成？自回归模型的“统治”要结束了

15:07

AITOP6月11日 15:07

每秒1107个token，Google开源的扩散模型为什么能改变本地推理格局？

5月26日

04:26

04:26

marktechpost@Sana Hassan

精选

本教程使用NVIDIA FLARE构建联邦学习实验，在非IID CIFAR-10数据集上比较FedAvg和FedProx算法。客户端数据通过Dirichlet分布分割以模拟现实中的标签不平衡。利用NVFlare Job API定义和启动联邦任务。教程包含具体实现步骤和性能对比。

技巧 FedAvg FedProx NVIDIA FLARE 联邦学习 CIFAR-10

推荐理由：手把手教你用NVIDIA FLARE做FedAvg和FedProx对比实验