全部 AI 动态 · AI 热点

6月18日

10:49

10:49

arXiv cs.AI@Diana Magalhães, Eva Maia, João Vitorino, Isabel Praça

XGBoost-Forget是一种针对XGBoost模型的机器遗忘方法，用于删除特定数据点而无需完全重新训练。该方法在IoT-23和GeNIS两个网络入侵表格数据集上评估，使用多项指标衡量模型性能、遗忘效率和遗忘质量。实验表明，XGBoost-Forget在保持接近原始模型预测性能的同时，实现显著更快的遗忘速度，展示了其在表格网络入侵场景中的潜力。

论文 XGBoost 机器遗忘 IoT-23 GeNIS 网络入侵检测

推荐理由：这篇论文提出了XGBoost-Forget，让XGBoost模型能快速遗忘特定数据，在入侵检测数据集上效果不错。

6月16日

20:46

AITOP6月16日 20:46

600亿美元买下Cursor，xAI终于拿到了编程工具，但真正值得跟踪的或许不是AI

600亿美元买下Cursor，xAI终于拿到了编程工具，但真正值得跟踪的或许不是AI

6月12日

13:47

13:47

arXiv cs.LG@Shaivi Malik

该论文提出一个探索性框架，将神经网络模型编辑形式化为强化学习问题，代理通过奖励反馈修改模型参数。框架包含两个环境：MaskWorld（乘法缩放权重）和 ShiftWorld（加法更新权重），奖励函数结合效用保持和任务特定编辑目标。在文本分类的偏见缓解和图像分类的机器遗忘任务上，学习到的策略在遗忘任务中将遗忘集准确率降至接近 0%，同时保留集准确率超过 90%；在偏见缓解中，偏见相关性能提升超 5% 且保持分类效用。结果表明，模型编辑可通过 RL 学习策略，无需为每个任务手动设计专用算法。

论文强化学习模型编辑偏见缓解机器遗忘 arXiv

推荐理由：这个框架让做模型微调或安全对齐的团队省去手动设计编辑算法的时间，直接用 RL 学习策略就能完成偏见缓解或遗忘任务，值得关注。

12:57

AITOP6月12日 12:57

Claude代码里藏了个20260612，18个月后的AI记忆革命已经开始倒计时

6月11日

15:28

AITOP6月11日 15:28

1107 vs 303：谷歌悄悄开源了一个“拆打字机”的模型，把大模型速度翻了4倍

15:23

AITOP6月11日 15:23

DiffusionGemma颠覆文本生成？自回归模型的“统治”要结束了

15:07

AITOP6月11日 15:07

每秒1107个token，Google开源的扩散模型为什么能改变本地推理格局？

5月15日

11:17

11:17

arXiv cs.LG@Saisab Sadhu, Pratinav Seth, Vinay Kumar Sankarapu

精选73°

现有机器遗忘评估仅在全精度模型上进行，但实际部署的语言模型都会经过量化。研究发现，4-bit量化可以逆转梯度下降法的遗忘效果，而能抵抗量化的方法又几乎不改变模型。MANSU通过因果电路归因定位最小遗忘子图，结合零空间投影和参数幅度下限，首次实现了遗忘效果在量化后不反弹。该方法还提出了电路归因散度（CAD）作为新的验证指标，能区分结构擦除与行为抑制。实验表明，MANSU在多个模型和基准上同时满足遗忘、保留、抗量化和结构擦除四个目标。

论文机器遗忘量化因果归因模型安全 MANSU

推荐理由：量化会悄悄恢复你辛苦抹掉的知识——MANSU解决了这个部署中的致命漏洞，做模型安全和对齐的团队值得关注这个新方法。