10:43arXiv cs.AI@Lekan Molu精选这篇论文提出用向后Kolmogorov方程将扩散策略提升至Cameron-Martin空间,以确定性PDE替代随机分数匹配。在PushT操作基准上,Cameron-Martin损失使最大回合奖励提升17%(0.95 vs 0.78),推理时步间漂移降低67.6%。在6站CONWIP制造线上,RMSE较LSTM降低28.4%,饥饿事件召回率达1.0,瓶颈识别Precision@1=1.0,信噪比13倍。结合Hamilton-Jacobi可达性理论,死锁事件减少96%(351次预防)。方法提供收敛保证、轨迹规整性和无奖励信号的故障检测。论文Kolmogorov回归扩散策略Cameron-Martin空间PushTCONWIP推荐理由:这篇论文用Kolmogorov方程改进了扩散策略,在PushT和制造线上奖励提升17%、漂移减少67%,还能做故障检测,比普通扩散方法靠谱。原文
11:04arXiv cs.AI@Adam Wei, Nicholas Pfaff, Thomas Cohn, Arif Kerem Dayı, Constantinos Daskalakis, Giannis Daras, Russ Tedrake精选72°机器人领域的高质量任务数据昂贵且难以收集,而次优数据(低质量或分布外演示)却大量存在。现有方法在同时训练两类数据时,常无法区分次优样本中的有用和有害特征。Ambient Diffusion Policy 通过引入噪声依赖的数据使用策略,仅在高和低扩散时间步利用次优数据,从而提取有用特征。该方法基于机器人动作数据的频谱幂律分布,利用全局到局部层次和局部性两个性质。在六项任务上,针对四种次优数据(噪声轨迹、仿真到现实差距、任务不匹配、大规模数据混合),该方法均有效,并在 Open X-Embodiment 数据集上比现有方法提升高达33%。论文机器人模仿学习扩散策略次优数据Open X-Embodiment推荐理由:机器人团队终于有了一个能高效利用次优数据的实用方法——Ambient Diffusion Policy 解决了低质量数据难以训练的问题,做机器人模仿学习的开发者可以直接在现有数据集上尝试,有望大幅降低数据收集成本。原文
AITOP5月29日 08:02Opus 4.8发布:编程助手的“静默时刻”,是解放开发者,还是新门槛?🔥Anthropic 把 AI 编程的“确认键”彻底删掉了!Claude Code 搭载全新 Opus 4.8 模型,长时间任务不跑偏、不废话、不中断,像一个资深工程师一样默默干活,从功能开发到漏洞清扫全包圆,你在旁边喝茶等结果就行。过去 AI 写代码三步一问“这样可以吗”,现在它直接交完整交付物……自主编程的最后一层窗户纸,被捅破了。做自动化开发和代码审查的团队,这个模型建议直接上手,效率差距肉眼可见……