6月11日
12:00
12:00arXiv cs.LG@Anamaria-Roberta Hartl, Levente Zólyomi, David Stap, Pieter-Jan Hoedt, Niklas Schmidinger, Lukas Hauzenberger, Sebastian Böck, Günter Klambauer, Sepp Hochreiter
精选
该论文系统比较了三种主流子二次架构(xLSTM、Mamba-2、Gated DeltaNet)在复杂任务上的表现,包括代码模型预训练、大模型蒸馏和时序基础模型预训练。结果显示,xLSTM 在所有任务中综合性能最优,其优势源于更灵活稳定的门控机制带来的状态追踪与记忆累积能力。研究通过统一公式分析和合成任务验证,揭示了 xLSTM 在长程依赖建模上的核心机制。
推荐理由:做序列建模或基础模型预训练的团队,这篇论文帮你厘清了 xLSTM 相比 Mamba 等架构的实际优势,看完可以直接指导模型选型。
11:58
11:58arXiv cs.LG@Leon Bergen, Usha Bhalla, Sidharth Baskaran, Max Loeffler, Raphael Sarfati, Dhruvil Gala, Ryan Panwar, Santiago Aranguri, Thomas Fel, Atticus Geiger, Matthew Kowal, Siddharth Boppana, Daniel Balsam, Owen Lewis, Jack Merullo, Thomas McGrath, Ekdeep Singh Lubana
精选
这篇论文提出了一种基于可解释性的后训练数据管道,用于诊断和修正偏好数据中的虚假关联。作者通过可解释性协议识别出数据中潜在的概念,让用户能明确哪些行为应该被模型学习。实验表明,该方法能有效缓解过度风格化、谄媚等不良行为,并增强安全性和个性等期望属性。这项工作将后训练从优化黑箱奖励转变为审计和塑造学习信号的过程。
推荐理由:做模型对齐和偏好优化的团队终于有了数据层面的诊断工具——不用再盲目调奖励权重,直接看数据教了模型什么。做安全对齐或模型人格定制的开发者建议点开,能省下大量试错时间。
11:29
11:29arXiv cs.AI@Steven Oh, Jason Jingzhou Liu, Tony Tao, Philip Han, Kenneth Shaw, Satoshi Funabashi, Ruslan Salakhutdinov, Deepak Pathak
精选
本文提出NEXT方法,通过数据驱动的方式仅用10分钟自由运动数据训练1分钟,即可估计机械臂外部关节力矩,无需专用力传感器。结合FIRST重采样训练策略,在行为克隆中提升接触任务表现,五个长时任务中任务进度提升超17%。该方法让低成本机械臂也能实现力反馈遥操作和策略学习,无需额外硬件。代码和视频已开源。
推荐理由:做机器人操作研究的团队终于有了低成本力感知方案——NEXT仅需10分钟数据就能替代昂贵传感器,FIRST让行为克隆在接触任务中提升17%进度,建议做遥操作或灵巧操作的开发者直接试。
10:59
10:59arXiv cs.AI@Kai Standvoss, Miriam Hägele, Rosemarie Krupar, Julika Ribbat-Idel, Jennifer Altschüler, Gerrit Erdmann, Hans Pinckaers, Evelyn Ramberger, Madleen Drinkwitz, Ádám Nárai, Alexander Möllers, Katja Lingelbach, Sebastian Kons, Lukas Hönig, Recepcan Adigüzel, Joana Baião, Alberto Megina Gonzalo, Marius Teodorescu, Marie-Lisa Eich, Paolo Chetta, Shakil Merchant, Verena Aumiller, Simon Schallenberg, Andrew Norgan, Klaus-Robert Müller, Lukas Ruff, Maximilian Alber, Frederick Klauschen
精选
Atlas H&E-TME 是一个基于 Atlas 病理基础模型的 AI 系统,能够从 H&E 染色的全切片图像中预测组织质量、区域和细胞类型,每张切片输出超过 4500 个细胞级定量指标。研究团队提出了双重验证框架:一方面利用免疫组化(IHC)信息构建多病理学家共识,作为分子层面的金标准;另一方面在超过 20 万条高置信度病理学家标注上测试,覆盖 8 种癌症类型、1500+ 病例。结果显示,Atlas H&E-TME 在 H&E 图像上的表现与病理学家相当甚至更优,且泛化能力强。这一系统将最普遍的 H&E 切片转化为可扩展的定量工具,为下一代组织生物标志物研究奠定基础。
推荐理由:病理分析终于有了可规模化的 AI 方案——Atlas H&E-TME 在 H&E 图像上达到专家级精度,做肿瘤微环境研究和临床转化的团队可以直接用上这套定量工具。
10:08
10:08arXiv cs.LG@Balázs Gyenes, Emiliyan Gospodinov, Jan Frieling, Enrico Krohmer, Nicolas Schreiber, Xiaogang Jia, Niklas Freymuth, Gerhard Neumann
精选
该研究提出将点云从笛卡尔空间映射到高维傅里叶空间,以解决神经网络在模仿学习中难以学习高频空间特征的问题。在 RoboCasa 和 ManiSkill3 基准测试以及真实机器人实验中,傅里叶特征显著提升了基于点云的策略在精细操控任务上的表现。该方法简单、鲁棒,且适用于多种编码器架构,有望成为点云模仿学习的通用工具。
推荐理由:做机器人操控和模仿学习的团队值得关注——傅里叶特征解决了神经网络对低频偏好的固有问题,让你在点云策略上直接获得高精度提升,代码和视频已开源,可以直接上手试。

仅展示最近 2000 条内容。更早的内容请查阅 AI 日报存档(侧边栏 → AI 日报 → 顶部「往期日报」)。