10:07arXiv: DeepSeek@Tianxiang Xu, Xiaoyan Zhu, Xin Lai, Xin Lian, Hangyu Cheng, Jiayin Wang精选现有软件缺陷检测研究缺乏针对生物信息学软件的专用数据集,导致模型在该领域表现受限。研究者推出了BioDefect,这是首个专为生物信息学软件缺陷检测设计的数据集,包含完整源代码仓库,保留了缺陷代码的真实上下文信息。该数据集解决了标签不一致和数据泄露问题,确保高质量和实验可靠性。在包括DeepSeek-R1在内的9个语言模型上的评估显示,BioDefect相比现有数据集平均F1分数提升29.61%至38.04%。这项工作填补了生物信息学软件缺陷检测的研究空白,为提升该领域软件质量保障提供了新方向。论文缺陷检测生物信息学数据集DeepSeek-R1软件质量推荐理由:做生物信息学软件质量保障的团队终于有了专用数据集——BioDefect 比通用数据集 F1 提升近 40%,做缺陷检测研究的可以直接用它来训练和评估模型。原文
11:09arXiv cs.LG@Antonio Peña Corredor, Julien Lesseur, Romain Nunez, Paul Rivalland, Thomas Philippe精选航空SiC/SiC复合材料的X射线CT无损检测依赖专家目视评估,缺乏可追溯性。研究团队提出p-ResNet-50,在卷积网络中引入原型层,将高检测精度与基于案例的解释结合。六个学习原型与专家定义的语义类别(健康基体、基体-空气界面、孔隙、线状缺陷、混合形态)对齐,每个分类都可追溯到物理有意义的参考。通过锚点和中心点正则化项防止原型坍缩,UMAP潜空间分析明确标出模型可靠与不可靠区域。在约12000个补丁的数据集上,p-ResNet-50达到与黑盒ResNet-50相当的精度(0.957 vs 0.959),同时提供可追溯决策和不确定性标记。论文可解释AI缺陷检测X射线CT原型网络SiC/SiC复合材料推荐理由:做工业无损检测或AI可解释性研究的团队会感兴趣——p-ResNet-50在保持高精度的同时让黑盒模型变得可审计,航空质检场景可以直接参考其原型对齐方法。原文