6月12日
6月11日
12:00
12:00arXiv cs.LG@Anamaria-Roberta Hartl, Levente Zólyomi, David Stap, Pieter-Jan Hoedt, Niklas Schmidinger, Lukas Hauzenberger, Sebastian Böck, Günter Klambauer, Sepp Hochreiter
精选
该论文系统比较了三种主流子二次架构(xLSTM、Mamba-2、Gated DeltaNet)在复杂任务上的表现,包括代码模型预训练、大模型蒸馏和时序基础模型预训练。结果显示,xLSTM 在所有任务中综合性能最优,其优势源于更灵活稳定的门控机制带来的状态追踪与记忆累积能力。研究通过统一公式分析和合成任务验证,揭示了 xLSTM 在长程依赖建模上的核心机制。
推荐理由:做序列建模或基础模型预训练的团队,这篇论文帮你厘清了 xLSTM 相比 Mamba 等架构的实际优势,看完可以直接指导模型选型。
11:58
11:58arXiv cs.LG@Leon Bergen, Usha Bhalla, Sidharth Baskaran, Max Loeffler, Raphael Sarfati, Dhruvil Gala, Ryan Panwar, Santiago Aranguri, Thomas Fel, Atticus Geiger, Matthew Kowal, Siddharth Boppana, Daniel Balsam, Owen Lewis, Jack Merullo, Thomas McGrath, Ekdeep Singh Lubana
精选
这篇论文提出了一种基于可解释性的后训练数据管道,用于诊断和修正偏好数据中的虚假关联。作者通过可解释性协议识别出数据中潜在的概念,让用户能明确哪些行为应该被模型学习。实验表明,该方法能有效缓解过度风格化、谄媚等不良行为,并增强安全性和个性等期望属性。这项工作将后训练从优化黑箱奖励转变为审计和塑造学习信号的过程。
推荐理由:做模型对齐和偏好优化的团队终于有了数据层面的诊断工具——不用再盲目调奖励权重,直接看数据教了模型什么。做安全对齐或模型人格定制的开发者建议点开,能省下大量试错时间。
11:29
11:29arXiv cs.AI@Steven Oh, Jason Jingzhou Liu, Tony Tao, Philip Han, Kenneth Shaw, Satoshi Funabashi, Ruslan Salakhutdinov, Deepak Pathak
精选
本文提出NEXT方法,通过数据驱动的方式仅用10分钟自由运动数据训练1分钟,即可估计机械臂外部关节力矩,无需专用力传感器。结合FIRST重采样训练策略,在行为克隆中提升接触任务表现,五个长时任务中任务进度提升超17%。该方法让低成本机械臂也能实现力反馈遥操作和策略学习,无需额外硬件。代码和视频已开源。
推荐理由:做机器人操作研究的团队终于有了低成本力感知方案——NEXT仅需10分钟数据就能替代昂贵传感器,FIRST让行为克隆在接触任务中提升17%进度,建议做遥操作或灵巧操作的开发者直接试。

仅展示最近 2000 条内容。更早的内容请查阅 AI 日报存档(侧边栏 → AI 日报 → 顶部「往期日报」)。