全部 AI 动态 · AI 热点

6月23日

12:06

12:06

arXiv: DeepSeek@Haitham Al-Shami, Rohail Malik, Riku Ala-Laurinaho, Jari Vepsäläinen, Raine Viitala

本文提出一个人机协作框架，自动识别并修复SysML v2模型中的语义错误。框架结合微调的小语言模型（SLM）与领域知识图谱，其中知识图谱编码系统元素间的物理兼容性规则。通过系统引入领域违规，知识图谱指导生成合成训练数据，并在推理时增强模型以提供符合工程约束的修复建议。在车辆系统领域，对Qwen2.5-Coder-1.5B和DeepSeek-Coder-6.7B进行微调，输出统一diff补丁来定位故障并呈现候选修复。在1184个测试样本上，微调将语义故障修复率从低于3%提升至超过91%，且补丁输出减少令牌长度超过60%。

论文 SysML v2 Qwen2.5-Coder-1.5B DeepSeek-Coder-6.7B 知识图谱模型验证

推荐理由：这篇论文提出一个好方法：用知识图谱加小模型自动修SysML v2语义错误，修复率飙到91%，相比传统编译器管不了语义错误，这招很实用。

6月16日

20:46

AITOP6月16日 20:46

600亿美元买下Cursor，xAI终于拿到了编程工具，但真正值得跟踪的或许不是AI

600亿美元买下Cursor，xAI终于拿到了编程工具，但真正值得跟踪的或许不是AI

6月12日

12:57

AITOP6月12日 12:57

Claude代码里藏了个20260612，18个月后的AI记忆革命已经开始倒计时

6月11日

15:28

AITOP6月11日 15:28

1107 vs 303：谷歌悄悄开源了一个“拆打字机”的模型，把大模型速度翻了4倍

15:23

AITOP6月11日 15:23

DiffusionGemma颠覆文本生成？自回归模型的“统治”要结束了

15:07

AITOP6月11日 15:07

每秒1107个token，Google开源的扩散模型为什么能改变本地推理格局？

5月14日

13:26

13:26

arXiv cs.LG@S. Akshay, Chaitanya Garg, Ashutosh Gupta, Kuldeep S. Meel, Ajinkya Naik

精选

该研究提出了一种量化决策树集成（DTE）模型敏感性的新方法，通过离散化输入空间并枚举易受干扰的区域，计算模型对特征微小变化的敏感程度。方法基于代数决策图（ADD）编码，将问题分解为可组合的子问题，在保证误差和置信度边界的同时实现高效计算。实验表明，工具XCount在多个基准测试中相比传统模型计数方法显著加速，且能随树集成规模扩展。这项工作对安全关键领域的AI验证具有重要意义。

论文决策树集成敏感性分析代数决策图模型验证安全关键AI

推荐理由：安全关键AI系统（如自动驾驶、医疗诊断）的开发者需要量化模型对输入扰动的鲁棒性，XCount提供了一种高效且可扩展的敏感性分析工具，值得关注。