AITP
精选全部 AI 动态AI 日报Agent 接入关于更新日志信源提报反馈
登录 / 注册
AITOP
全部 AI 动态
AI 相关资讯全量信息流
全部博客资讯推文论文
全部模型产品行业论文技巧
标签:模型验证×
6月23日
12:06
12:06arXiv: DeepSeek@Haitham Al-Shami, Rohail Malik, Riku Ala-Laurinaho, Jari Vepsäläinen, Raine Viitala
本文提出一个人机协作框架,自动识别并修复SysML v2模型中的语义错误。框架结合微调的小语言模型(SLM)与领域知识图谱,其中知识图谱编码系统元素间的物理兼容性规则。通过系统引入领域违规,知识图谱指导生成合成训练数据,并在推理时增强模型以提供符合工程约束的修复建议。在车辆系统领域,对Qwen2.5-Coder-1.5B和DeepSeek-Coder-6.7B进行微调,输出统一diff补丁来定位故障并呈现候选修复。在1184个测试样本上,微调将语义故障修复率从低于3%提升至超过91%,且补丁输出减少令牌长度超过60%。
论文SysML v2Qwen2.5-Coder-1.5BDeepSeek-Coder-6.7B知识图谱模型验证

推荐理由:这篇论文提出一个好方法:用知识图谱加小模型自动修SysML v2语义错误,修复率飙到91%,相比传统编译器管不了语义错误,这招很实用。
原文
6月16日
20:46
AITOP6月16日 20:46
600亿美元买下Cursor,xAI终于拿到了编程工具,但真正值得跟踪的或许不是AI600亿美元买下Cursor,xAI终于拿到了编程工具,但真正值得跟踪的或许不是AI
6月12日
12:57
AITOP6月12日 12:57
Claude代码里藏了个20260612,18个月后的AI记忆革命已经开始倒计时
6月11日
15:28
AITOP6月11日 15:28
1107 vs 303:谷歌悄悄开源了一个“拆打字机”的模型,把大模型速度翻了4倍
15:23
AITOP6月11日 15:23
DiffusionGemma颠覆文本生成?自回归模型的“统治”要结束了
15:07
AITOP6月11日 15:07
每秒1107个token,Google开源的扩散模型为什么能改变本地推理格局?
5月14日
13:26
13:26arXiv cs.LG@S. Akshay, Chaitanya Garg, Ashutosh Gupta, Kuldeep S. Meel, Ajinkya Naik
精选
该研究提出了一种量化决策树集成(DTE)模型敏感性的新方法,通过离散化输入空间并枚举易受干扰的区域,计算模型对特征微小变化的敏感程度。方法基于代数决策图(ADD)编码,将问题分解为可组合的子问题,在保证误差和置信度边界的同时实现高效计算。实验表明,工具XCount在多个基准测试中相比传统模型计数方法显著加速,且能随树集成规模扩展。这项工作对安全关键领域的AI验证具有重要意义。
论文决策树集成敏感性分析代数决策图模型验证安全关键AI

推荐理由:安全关键AI系统(如自动驾驶、医疗诊断)的开发者需要量化模型对输入扰动的鲁棒性,XCount提供了一种高效且可扩展的敏感性分析工具,值得关注。
原文
精选全部日报登录