arXiv cs.AI@Guangzhi Xiong, Qiao Jin, Sanchit Sinha, Zhiyong Lu, Aidong Zhang精选52大型视觉语言模型在医疗应用中潜力巨大,但其回答缺乏视觉证据的可信归因,引发临床信任问题。现有归因方法无法验证是否真正反映模型决策依据,因为缺乏内部推理的真实标注。研究者开发了因果评估框架,通过反事实编辑验证专家标注区域是否因果影响模型预测,并测试了11种归因方法、6个开源LVLM和两种输出模式。结果发现现有方法常无法识别模型使用的视觉证据。为此提出MedFocus,基于不平衡最优传输定位临床解剖区域,并通过定向干预测量因果效应,在空间、概念和词元层面显著优于现有方法。数据和代码已开源。论文视觉归因医学影像因果评估LVLM开源/仓库推荐理由:医疗AI的信任危机终于有了可验证的归因方案——MedFocus让医生能看清模型到底看了哪里才下诊断,做医学影像AI的团队值得试试这个因果框架。
arXiv cs.AI@Tonghao Zhuang, Shanglong Hu, Yongsheng Luo, Zhiqi Zhang, Yu Li精选52该研究提出了一种半监督框架,用于胎儿心脏超声图像的联合分割与分类。方法基于EchoCare多任务骨干网络,集成SAM-Med2D进行边界细化,并利用DINOv3提升伪标签质量。引入视图特定硬掩码和两阶段优化策略:EMA阶段巩固分割能力,分类微调阶段冻结分割参数并重置分类头,以恢复分类性能而不损害分割效果。在FETUS 2026排行榜上,该方法达到79.99%的Dice系数、61.62%的归一化表面距离和41.20%的F1分数,验证了其在产前先天性心脏病筛查中的有效性。代码已开源。论文半监督学习医学影像胎儿心脏超声SAM-Med2DDINOv3推荐理由:这项研究解决了胎儿心脏超声分析中标注数据稀缺的痛点,做医学影像AI的团队可以直接参考其半监督框架和开源代码,值得关注。
arXiv cs.LG@Chaeyeon Lee, Sehwan Kim, Hyungrok Do精选37QSurv 是一个可扩展的深度学习框架,用于非参数连续时间生存建模,避免了传统方法对时间离散化或分布假设的依赖。它采用 Gauss-Legendre 数值积分来近似累积风险函数,实现高效端到端训练。此外,QSurv 引入了时间条件低秩适配机制,使神经网络能够动态捕捉非平稳风险动态。理论分析证明了累积风险评估的误差界。在合成数据、大规模表格数据和医学影像任务上,QSurv 在预测性能和风险函数估计方面均优于现有方法。论文生存模型非参数建模数值积分深度学习医学影像推荐理由:生存分析领域终于有了一个不依赖离散化或分布假设的深度学习方案,做医学影像或高维数据风险建模的团队可以直接用 QSurv 获得更准确的风险曲线,值得关注。