11:12arXiv cs.AI@Aray Karjauv这篇论文指出,现代图像分类器使用的全局平均池化(GAP)加线性分类头的结构,使图像级logits等于特征网格上逐点分类后logits的平均值。这种线性性意味着标准分类器本质上是多实例学习器(MIL),将图像视为空间实例的包。实验发现,即使图像级预测错误,分类器仍在特征网格中保留了空间类别证据,且现成模型(off-the-shelf models)能稳定恢复前景区域的地面真实类别。该研究将GAP隐藏的空间信息重新提取出来,为模型诊断提供了新思路。论文GAP多实例学习图像分类分类器MIL推荐理由:用GAP隐藏的空间证据诊断分类错误原文
10:50arXiv cs.LG@Ethan Harvey, Dennis Johan Loevlie, Michael C. Hughes精选在3D医学图像分析中,通常只有整个体积的单一标签,而非每张2D切片都有标签。弱监督学习下,注意力机制的多实例学习(MIL)可为每张切片生成注意力分数,但近期研究发现,一个忽略图像内容的简单中心聚焦基线方法,在脑部扫描切片分类上竟优于基于注意力和Transformer的MIL方法。该研究进一步验证,该基线在胸部和腹部CT扫描的切片分类上也表现更优。为此,作者提出Normal Guidance正则化技术,鼓励学习到的注意力分布遵循钟形曲线。在三个医学影像数据集(总计超过400万张2D切片)上,Normal Guidance使基于注意力和Transformer的MIL方法在切片级定位上显著优于现有技术,同时在全扫描分类上保持竞争力。论文弱监督学习注意力机制医学影像正则化MIL推荐理由:做医学影像分析的团队终于有了一个简单有效的正则化技巧——Normal Guidance能显著提升弱监督下的切片定位精度,比现有MIL方法更准,建议做3D医学图像分类的开发者试试。原文