12:06arXiv: DeepSeek@Haitham Al-Shami, Rohail Malik, Riku Ala-Laurinaho, Jari Vepsäläinen, Raine Viitala本文提出一个人机协作框架,自动识别并修复SysML v2模型中的语义错误。框架结合微调的小语言模型(SLM)与领域知识图谱,其中知识图谱编码系统元素间的物理兼容性规则。通过系统引入领域违规,知识图谱指导生成合成训练数据,并在推理时增强模型以提供符合工程约束的修复建议。在车辆系统领域,对Qwen2.5-Coder-1.5B和DeepSeek-Coder-6.7B进行微调,输出统一diff补丁来定位故障并呈现候选修复。在1184个测试样本上,微调将语义故障修复率从低于3%提升至超过91%,且补丁输出减少令牌长度超过60%。论文SysML v2Qwen2.5-Coder-1.5BDeepSeek-Coder-6.7B知识图谱模型验证推荐理由:这篇论文提出一个好方法:用知识图谱加小模型自动修SysML v2语义错误,修复率飙到91%,相比传统编译器管不了语义错误,这招很实用。原文
13:26arXiv cs.LG@S. Akshay, Chaitanya Garg, Ashutosh Gupta, Kuldeep S. Meel, Ajinkya Naik精选该研究提出了一种量化决策树集成(DTE)模型敏感性的新方法,通过离散化输入空间并枚举易受干扰的区域,计算模型对特征微小变化的敏感程度。方法基于代数决策图(ADD)编码,将问题分解为可组合的子问题,在保证误差和置信度边界的同时实现高效计算。实验表明,工具XCount在多个基准测试中相比传统模型计数方法显著加速,且能随树集成规模扩展。这项工作对安全关键领域的AI验证具有重要意义。论文决策树集成敏感性分析代数决策图模型验证安全关键AI推荐理由:安全关键AI系统(如自动驾驶、医疗诊断)的开发者需要量化模型对输入扰动的鲁棒性,XCount提供了一种高效且可扩展的敏感性分析工具,值得关注。原文