10:49arXiv cs.AI@Diana Magalhães, Eva Maia, João Vitorino, Isabel PraçaXGBoost-Forget是一种针对XGBoost模型的机器遗忘方法,用于删除特定数据点而无需完全重新训练。该方法在IoT-23和GeNIS两个网络入侵表格数据集上评估,使用多项指标衡量模型性能、遗忘效率和遗忘质量。实验表明,XGBoost-Forget在保持接近原始模型预测性能的同时,实现显著更快的遗忘速度,展示了其在表格网络入侵场景中的潜力。论文XGBoost机器遗忘IoT-23GeNIS网络入侵检测推荐理由:这篇论文提出了XGBoost-Forget,让XGBoost模型能快速遗忘特定数据,在入侵检测数据集上效果不错。原文
13:47arXiv cs.LG@Shaivi Malik该论文提出一个探索性框架,将神经网络模型编辑形式化为强化学习问题,代理通过奖励反馈修改模型参数。框架包含两个环境:MaskWorld(乘法缩放权重)和 ShiftWorld(加法更新权重),奖励函数结合效用保持和任务特定编辑目标。在文本分类的偏见缓解和图像分类的机器遗忘任务上,学习到的策略在遗忘任务中将遗忘集准确率降至接近 0%,同时保留集准确率超过 90%;在偏见缓解中,偏见相关性能提升超 5% 且保持分类效用。结果表明,模型编辑可通过 RL 学习策略,无需为每个任务手动设计专用算法。论文强化学习模型编辑偏见缓解机器遗忘arXiv推荐理由:这个框架让做模型微调或安全对齐的团队省去手动设计编辑算法的时间,直接用 RL 学习策略就能完成偏见缓解或遗忘任务,值得关注。原文
11:17arXiv cs.LG@Saisab Sadhu, Pratinav Seth, Vinay Kumar Sankarapu精选73°现有机器遗忘评估仅在全精度模型上进行,但实际部署的语言模型都会经过量化。研究发现,4-bit量化可以逆转梯度下降法的遗忘效果,而能抵抗量化的方法又几乎不改变模型。MANSU通过因果电路归因定位最小遗忘子图,结合零空间投影和参数幅度下限,首次实现了遗忘效果在量化后不反弹。该方法还提出了电路归因散度(CAD)作为新的验证指标,能区分结构擦除与行为抑制。实验表明,MANSU在多个模型和基准上同时满足遗忘、保留、抗量化和结构擦除四个目标。论文机器遗忘量化因果归因模型安全MANSU推荐理由:量化会悄悄恢复你辛苦抹掉的知识——MANSU解决了这个部署中的致命漏洞,做模型安全和对齐的团队值得关注这个新方法。原文