10:57
10:57
arXiv cs.LG@Nikita Kachaev, Andrey Moskalenko, Matvey Skripkin, Nikita Kurlaev, Daria Pugacheva, Albina Burlova, Mikhail Kolosov, Denis Shepelev, Andrey Kuznetsov, Elena Tutubalina, Aleksandr I. Panov, Alexey K. Kovalev, Vlad Shakhuro 论文提出 Act2Answer 协议,通过让智能体在桌面场景中执行物体放置动作来选择答案,从而在动作层面评估 7 个 VLA 模型和 9 个 VLM 基线在常识与知识任务上的表现。研究发现,VLA 在简单概念上表现扎实,但在丰富语义类别上相比源 VLM 出现更大差距。实验还表明,VQA 联合训练有助于提升知识保留,而答案相关信息在 VLA 中层达到峰值,上层则衰减。
推荐理由:想知道微调后的机器人模型到底还记不记得常识?这篇论文用动作答题的方式测了7个VLA,发现简单概念还行,复杂知识掉得厉害。
10:57
10:57
arXiv cs.LG@Jiaqing Zhang, Sabyasachi Bandyopadhyay, Miguel Contreras, Jessica Sena, Yuanfang Ren, Andrea Davidson, Ziyuan Guan, Tezcan Ozrazgat-Baslanti, Subhash Nerella, Azra Bihorac, Parisa Rashidi 该研究探讨环境声音和光照强度能否独立预测ICU谵妄。基于9个ICU的309名患者数据,评估了四种高效序贯神经网络模型在10个预测窗口上的表现。卷积模型在声音数据上取得最强辨别能力,AUC达0.80。结合声音与光照可改善短期(<1周)预测,模型在感知期结束后立即分配最高风险。
推荐理由:这篇论文发现ICU里的环境声音比光照更能预测谵妄,卷积模型AUC达到0.80,为无创预警提供了新思路。
10:31
10:31
arXiv cs.LG@Daochen Zha, Chun How Tan, Xin Liu, Bin Xu, Han Zhao, Xiaowei Liu, Tracy Yu, Hui Gao, Huiji Gao, Liwei He, Stephanie Moyerman, Sanjeev Katariya JourneyFormer是Airbnb提出的序列建模解决方案,用于处理搜索排序中客人序列长、探索性强且标签稀疏的问题。模型设计涵盖事件选择、ID嵌入、模型架构和标签归因等关键环节,并采用专门策略加速训练和推理。JourneyFormer已部署到Airbnb生产环境,离线排名指标和线上A/B测试(覆盖2个生产表面)均显示关键业务指标显著提升。
推荐理由:Airbnb搞了个JourneyFormer,专治搜索排序中又长又乱的用户序列,实测线上A/B测试效果很不错。
仅展示最近 2000 条内容。更早的内容请查阅 AI 日报存档(侧边栏 → AI 日报 → 顶部「往期日报」)。