12:26arXiv cs.LG@Alper Yıldırım论文复现了Oppenheim和Lim(1981)的经典实验,在隐藏层中测试相位与幅度对图像识别的影响。在PRISM2D、GFNet和ViT-B/16中,预测完全跟随相位或符号捐赠者,删除幅度信息后准确率几乎不变。ResNet-50在ReLU后看似不遵循此模式,但ReLU前的干预显示晚期块中存在强相位编码,且DC-only控制表明读取器依赖通道式空间平均。这些架构共享相位/符号身份编码,但因整流和读取几何暴露在不同基底上,为CNN与注意力模型间的纹理-形状差距提供了机理解释。论文PRISM2DGFNetViT-B/16ResNet-50相位编码图像分类神经网络推荐理由:这篇论文用Oppenheim-Lim实验方法测试了多个模型(ViT、CNN)的内部表示,发现相位才是关键,还解释了为什么CNN和ViT对纹理和形状的偏好不同。原文
11:12arXiv cs.AI@Aray Karjauv这篇论文指出,现代图像分类器使用的全局平均池化(GAP)加线性分类头的结构,使图像级logits等于特征网格上逐点分类后logits的平均值。这种线性性意味着标准分类器本质上是多实例学习器(MIL),将图像视为空间实例的包。实验发现,即使图像级预测错误,分类器仍在特征网格中保留了空间类别证据,且现成模型(off-the-shelf models)能稳定恢复前景区域的地面真实类别。该研究将GAP隐藏的空间信息重新提取出来,为模型诊断提供了新思路。论文GAP多实例学习图像分类分类器MIL推荐理由:用GAP隐藏的空间证据诊断分类错误原文
11:11arXiv cs.AI@Rafi Ahamed, Md. Abir Rahman, Tasnia Tarannum Roza, Munaia Jannat Easha, Md. Asif Khan, Sudeepta MandalCottonLeafVision框架为棉花叶病分类而生,评估了DenseNet201、InceptionV3和VGG19等预训练模型。在包含6类病害和1类健康的7类公开数据集上,DenseNet201达到了98%的最高分类准确率。框架采用Grad-CAM、遮挡敏感分析和对抗训练来增强模型可解释性与噪声鲁棒性。最后,团队开发了原型,用于实际农业场景中的病害管理。AI模型CottonLeafVisionDenseNet201图像分类农业AI可解释AI推荐理由:98%准确率识别棉花叶病原文