AITP
精选全部 AI 动态AI 日报Agent 接入关于更新日志信源提报反馈
登录 / 注册
AITOP
全部 AI 动态
AI 相关资讯全量信息流
全部博客资讯推文论文
全部模型产品行业论文技巧
标签:CIFAR-10×
6月23日
10:41
10:41arXiv cs.LG@Lei Li, Yuexiao Dong
研究者提出用f-散度诱导的非线性变换替换扩散模型的标准MSE去噪损失,在CIFAR-10数据集30%污染条件下,负指数散度(NED)将FID从93.0(KL散度)降至77.5。该方法基于局部散度构造,利用DDPM高斯反向核结构将每步条件f-散度简化为去噪误差的一维函数。Hellinger散度产生显式指数权重,连接至稳健M估计框架。实验显示NED优于Huber损失和截断MSE等常见鲁棒损失。
论文扩散模型f-散度CIFAR-10FID稳健训练

推荐理由:这篇论文改进了扩散模型的抗污染能力,用f-散度加权去噪在CIFAR-10上30%污染时FID从93降到77,比常用鲁棒损失好用。
原文
6月18日
10:29
10:29arXiv cs.LG@Alexandre Lemire Paquin, Brahim Chaib-Draa, Philippe Giguère
本文研究利用平滑损失函数对PAC-Bayes界进行去随机化,以获得确定性预测器的高概率泛化界。通过后验均值从Gibbs预测器到确定性预测器的代价由Jensen gap类的泛化差距给出,并通过Rademacher复杂度控制。得到的界涉及参数Jacobian和得分映射Hessian表示的平坦度量,适用于有界和无界平滑损失,并特例化为线性预测器和平滑神经网络。理论中的Jacobian和Hessian量启发了一个实用的正则化器,对BatchNorm网络在CIFAR-10上进行了不同批量大小下的实验。
论文PAC-Bayes泛化界正则化器JacobianCIFAR-10

推荐理由:这篇论文从PAC-Bayes理论推导出一个基于Jacobian和Hessian的新正则化器,在CIFAR-10上验证有效,值得搞泛化理论的人看看。
原文
6月16日
20:46
AITOP6月16日 20:46
600亿美元买下Cursor,xAI终于拿到了编程工具,但真正值得跟踪的或许不是AI600亿美元买下Cursor,xAI终于拿到了编程工具,但真正值得跟踪的或许不是AI
09:51
09:51arXiv cs.LG@Zhenyu Yu
InstantForget是一种新的后门遗忘方法,无需更新模型参数即可在推理时移除恶意触发行为。在CIFAR-10 ResNet-18上,它针对BadNets、WaNet、Blended和SIG四种触发方式,将平均攻击成功率(ASR)降至0.071。该方法通过马氏距离标记异常特征并重置为中性表示,达到0.981的检测AUROC,并成功迁移至六种主干网络。论文还揭示了投影假设在WaNet等触发下的失效(ASR分别达0.683、0.888和0.941),并用logit-trilplet间隙预测失败。
论文InstantForget后门攻击模型安全CIFAR-10推理时

推荐理由:这篇论文提出InstantForget,不用重新训练就能清除模型后门,在CIFAR-10上把攻击成功率压到7%,还搞了个检测机制AUROC 98%,挺实用的。
原文
6月12日
12:57
AITOP6月12日 12:57
Claude代码里藏了个20260612,18个月后的AI记忆革命已经开始倒计时
6月11日
15:28
AITOP6月11日 15:28
1107 vs 303:谷歌悄悄开源了一个“拆打字机”的模型,把大模型速度翻了4倍
15:23
AITOP6月11日 15:23
DiffusionGemma颠覆文本生成?自回归模型的“统治”要结束了
15:07
AITOP6月11日 15:07
每秒1107个token,Google开源的扩散模型为什么能改变本地推理格局?
5月26日
04:26
04:26marktechpost@Sana Hassan
精选
本教程使用NVIDIA FLARE构建联邦学习实验,在非IID CIFAR-10数据集上比较FedAvg和FedProx算法。客户端数据通过Dirichlet分布分割以模拟现实中的标签不平衡。利用NVFlare Job API定义和启动联邦任务。教程包含具体实现步骤和性能对比。
技巧FedAvgFedProxNVIDIA FLARE联邦学习CIFAR-10

推荐理由:手把手教你用NVIDIA FLARE做FedAvg和FedProx对比实验
原文
精选全部日报登录