09:11arXiv cs.AI@Zian Yang, Zixin Wang少样本字体生成需要同时保证全局结构完整性和局部风格细节。现有方法要么依赖全局内容-风格建模(鲁棒但解耦不完美),要么强调局部组件建模(捕捉细节但依赖局部先验和参考覆盖)。SmartFont 提出通过多级条件分配来组织互补但有偏的全局和局部条件,结合扩散模型与弱监督局部校正专家,实现全局-局部平衡。实验表明,该方法在字形质量和局部细节保真度上优于现有方法。论文少样本字体生成扩散模型条件分配弱监督学习SmartFont推荐理由:字体设计团队和AI生成研究者可以关注这个方案——它解决了少样本字体生成中全局与局部细节难以兼顾的痛点,直接提升字形质量和风格一致性。原文
12:02arXiv cs.AI@Alexander Möllers, Marvin Sextro, Julius Hense, Gabriel Dernbach, Klaus-Robert Müller精选多实例学习(MIL)处理的是包级别监督的问题,在计算病理学、卫星图像等领域有广泛应用。但现有算法在低标签数据场景下表现不佳,灵活模型容易过拟合,刚性模型难以适应新任务。本文提出一种基于Perceiver架构的上下文学习器,在合成数据上预训练后,仅需少量标注包即可解决新任务,推理时单次前向传播完成,无需梯度更新。研究设计了多种合成数据生成器,它们捕获互补的归纳偏置,混合预训练模型在12个MIL基准上平均性能最优,超越需要任务特定训练的监督基线。论文多实例学习上下文学习Perceiver架构弱监督学习合成数据推荐理由:做弱监督学习或医疗图像分析的团队,终于有了一个无需微调就能从少量标注包中学习的方案——单次前向传播搞定,值得直接试试。原文
10:50arXiv cs.LG@Ethan Harvey, Dennis Johan Loevlie, Michael C. Hughes精选在3D医学图像分析中,通常只有整个体积的单一标签,而非每张2D切片都有标签。弱监督学习下,注意力机制的多实例学习(MIL)可为每张切片生成注意力分数,但近期研究发现,一个忽略图像内容的简单中心聚焦基线方法,在脑部扫描切片分类上竟优于基于注意力和Transformer的MIL方法。该研究进一步验证,该基线在胸部和腹部CT扫描的切片分类上也表现更优。为此,作者提出Normal Guidance正则化技术,鼓励学习到的注意力分布遵循钟形曲线。在三个医学影像数据集(总计超过400万张2D切片)上,Normal Guidance使基于注意力和Transformer的MIL方法在切片级定位上显著优于现有技术,同时在全扫描分类上保持竞争力。论文弱监督学习注意力机制医学影像正则化MIL推荐理由:做医学影像分析的团队终于有了一个简单有效的正则化技巧——Normal Guidance能显著提升弱监督下的切片定位精度,比现有MIL方法更准,建议做3D医学图像分类的开发者试试。原文
11:46arXiv cs.AI@Xu Yao, Siyuan Zhou, Wu Zhenbo, Chaochuan Hou, Shuang Liang, Shiping wang, Hailiang Huang, Songqiao Han, Minqi Jiang精选弱监督异常检测(WSAD)长期分为不完整、不精确和不准确三种监督方向,但缺乏统一评估框架。该论文提出WSADBench,首个跨场景统一基准,系统评估了36种算法在4种模态下的表现,基于超过70万次实验。研究发现:弱监督场景间存在强相关性,挑战了当前研究方向的孤立性;专用WSAD算法仅在极端标签稀缺时占优,随监督增强或面对分布外数据时,表格基础模型和通用分类方法迅速超越;无标签数据在不同设置下效用不一致,相比标签精炼收益有限;模型对不同类型标签噪声的敏感性不对称。该基准已开源,旨在推动WSAD研究。论文弱监督学习异常检测基准/评估表格基础模型WSADBench推荐理由:做异常检测或弱监督学习的团队终于有了统一评估工具——WSADBench用70万次实验戳破了三个方向各自为战的假象,看完你会重新思考该用专用算法还是通用模型。原文
13:27arXiv cs.AI@Urvi Gianchandani, Praveen Tirupattur, Mubarak Shah精选该论文提出一种弱监督方法,仅利用视频级标签(正常/异常)训练网络,无需帧级或像素级标注。通过多实例排序损失(MIL)将异常和正常视频片段分别视为正包和负包,提取特征并训练分类器,从而为时空区域生成异常分数。方法同时检测时间(片段级)和空间(帧内局部区域)异常,在UCF Crime2Local数据集上验证了有效性。这解决了视频异常标注成本高的问题,为实际监控场景提供了更实用的方案。论文弱监督学习异常检测时空检测多实例学习UCF Crime2Local推荐理由:做视频监控或异常检测的团队,不用逐帧标注就能定位异常区域,直接省下大量标注成本,值得关注。原文