11:12arXiv cs.AI@Aray Karjauv这篇论文指出,现代图像分类器使用的全局平均池化(GAP)加线性分类头的结构,使图像级logits等于特征网格上逐点分类后logits的平均值。这种线性性意味着标准分类器本质上是多实例学习器(MIL),将图像视为空间实例的包。实验发现,即使图像级预测错误,分类器仍在特征网格中保留了空间类别证据,且现成模型(off-the-shelf models)能稳定恢复前景区域的地面真实类别。该研究将GAP隐藏的空间信息重新提取出来,为模型诊断提供了新思路。论文GAP多实例学习图像分类分类器MIL推荐理由:用GAP隐藏的空间证据诊断分类错误原文
12:02arXiv cs.AI@Alexander Möllers, Marvin Sextro, Julius Hense, Gabriel Dernbach, Klaus-Robert Müller精选多实例学习(MIL)处理的是包级别监督的问题,在计算病理学、卫星图像等领域有广泛应用。但现有算法在低标签数据场景下表现不佳,灵活模型容易过拟合,刚性模型难以适应新任务。本文提出一种基于Perceiver架构的上下文学习器,在合成数据上预训练后,仅需少量标注包即可解决新任务,推理时单次前向传播完成,无需梯度更新。研究设计了多种合成数据生成器,它们捕获互补的归纳偏置,混合预训练模型在12个MIL基准上平均性能最优,超越需要任务特定训练的监督基线。论文多实例学习上下文学习Perceiver架构弱监督学习合成数据推荐理由:做弱监督学习或医疗图像分析的团队,终于有了一个无需微调就能从少量标注包中学习的方案——单次前向传播搞定,值得直接试试。原文
13:27arXiv cs.AI@Urvi Gianchandani, Praveen Tirupattur, Mubarak Shah精选该论文提出一种弱监督方法,仅利用视频级标签(正常/异常)训练网络,无需帧级或像素级标注。通过多实例排序损失(MIL)将异常和正常视频片段分别视为正包和负包,提取特征并训练分类器,从而为时空区域生成异常分数。方法同时检测时间(片段级)和空间(帧内局部区域)异常,在UCF Crime2Local数据集上验证了有效性。这解决了视频异常标注成本高的问题,为实际监控场景提供了更实用的方案。论文弱监督学习异常检测时空检测多实例学习UCF Crime2Local推荐理由:做视频监控或异常检测的团队,不用逐帧标注就能定位异常区域,直接省下大量标注成本,值得关注。原文