精选理由
做持续学习或CLIP微调的团队,AREA把增量遗忘的根因拆解为属性提取与聚合两个环节,并给出了可落地的解耦方案,值得看看代码和实验细节。
本文提出AREA方法,针对CLIP模型在类增量学习(CIL)中的灾难性遗忘问题。传统CLIP通过模板提示(如“一张[类别]的照片”)进行视觉与文本嵌入的相似度匹配,但该过程可分解为属性提取与属性聚合两个阶段。由于增量学习仅能访问当前任务数据,模型容易偏向新类别。AREA通过主测地线分析在超球面嵌入空间锚定属性,并引入轻量级任务专家与变分信息瓶颈正则化来稳定聚合。推理时利用最优传输进行任务属性流路由,实现更精确预测。实验表明,AREA在多个基准上超越现有最先进方法。
AI 翻译 · 中文
本文提出AREA方法,针对CLIP模型在类增量学习(CIL)中的灾难性遗忘问题。传统CLIP通过模板提示(如“一张[类别]的照片”)进行视觉与文本嵌入的相似度匹配,但该过程可分解为属性提取与属性聚合两个阶段。由于增量学习仅能访问当前任务数据,模型容易偏向新类别。AREA通过主测地线分析在超球面嵌入空间锚定属性,并引入轻量级任务专家与变分信息瓶颈正则化来稳定聚合。推理时利用最优传输进行任务属性流路由,实现更精确预测。实验表明,AREA在多个基准上超越现有最先进方法。
Class-Incremental Learning (CIL) is important in building real-world learning systems. In CLIP-based CIL, the model performs classification by comparing similarity between visual and textual embeddings obtained from temp…