全部 AI 动态 · AI 热点

6月11日

12:31

arXiv cs.AI@Mingjia Li, Jin Wu, Hong Qian, Wenhao Huang, Yiyang Huang, Yiwen Zhang, Chanjin Zheng, Xiangfeng Wang, Aimin Zhou, Jiajun Guo

精选

IntElicit 是一个用于评估情境化创造力的框架，它通过对话策略优化来减少认知能力和参与意愿等非创造性因素的干扰。该框架作为自适应 AI 面试官，在多轮交互中提供非指导性知识和参与支持，同时保留参与者生成创造性内容的责任。它引入分解过程奖励机制，避免奖励作弊，鼓励引导参与者推理而非直接给出答案。实验表明，IntElicit 能比专家设计的基线方法更好地激发创造性成果，揭示静态评估可能遗漏的创造潜力。这为 AI 辅助学习中的情境化创造力评估提供了形成性和诊断性视角。

论文创造力评估对话策略优化 AI面试官情境化评估教育AI

推荐理由：做创造力评估或 AI 教育对话系统的研究者值得关注——IntElicit 解决了静态测试无法捕捉真实创造力的痛点，用对话策略优化让评估更贴近实际场景。

原文

12:30

arXiv cs.AI@Semih Vazgecen, Cristian Sestito, Spyros Stathopoulos, Themis Prodromakis

精选

该研究提出一种结合轻量级生成对抗网络（GAN）和忆阻器神经形态系统的面部识别框架，专门解决非正面人脸图像的识别难题。通过GAN将非正面人脸正面化，再使用忆阻器分类器进行高效识别，在资源受限平台（如无人机）上实现96%的准确率。该方法缓解了传统AI的计算瓶颈，为动态真实环境中的面部识别提供了可扩展、高效的边缘AI解决方案。

论文 GAN 忆阻器面部识别边缘AI 神经形态计算

推荐理由：边缘AI设备（如无人机）做非正面人脸识别一直受限于算力，这个方案用GAN正面化+忆阻器低功耗推理，准确率还到96%，做嵌入式视觉或边缘计算的团队值得关注。

原文

12:28

arXiv cs.AI@Jason Miklian, John E. Katsos

76°

一项研究分析了 2023-2026 年间 Hacker News 和 Reddit 上的 2500 万条评论，发现用户指控他人使用 AI 生成内容的标签（如“AI slop”）在四年内增长了十倍以上。研究者通过 7500 条样本的 LLM 判断、情感轨迹分析、300 条确认指控的言语行为编码以及匹配对照测试，发现指控行为更多是社交筛选和群体认同的体现，而非真正识别 AI 内容。关键发现是：能统计上区分 AI 与人类文本的文体特征，并不能预测哪些人类文本会被指控为 AI。这表明，AI 对写作的读者端影响与生产者端截然不同，检测技术无法解决这一动态，因为指控的社会功能已转向社交把关和内部信号传递。

论文 AI 检测社交筛选在线社区 AI 垃圾信号理论

推荐理由：这项研究戳破了“AI 检测”的幻觉——做社区运营、内容审核或研究 AI 社会影响的读者会看到，指控 AI 更多是社交标签而非技术判断，值得反思当前反 AI 情绪的真实驱动力。

原文

12:21

rohanpaul_ai@rohanpaul_ai

精选

一篇新论文指出，稀疏自编码器作为LLM控制工具表现不佳的结论可能源于特征标签错误，而非方法本身缺陷。早期研究因标签与模型内部实际因果行为不匹配，导致稀疏自编码器看起来效果差。作者提出监督式管道，通过验证特征活动是否可靠追踪真实数据标签来替换模糊标签，并发现高稀疏性并非必要。尽管提示工程仍更强，但特征控制可直接操纵模型内部机制，为模型行为调控提供新思路。

论文稀疏自编码器 LLM控制特征标签可解释性因果权重

推荐理由：这篇论文为LLM控制领域拨乱反正——做模型可解释性、安全对齐或行为调控的团队，值得重新审视稀疏自编码器的潜力，建议点开看看如何用标签修正提升控制效果。

原文

12:11

arXiv cs.AI@Soumitra Sinhahajari, Navonil Majumder, Soujanya Poria

精选

该研究指出，用 LLM 作为裁判来评估科学问题的新颖性存在严重缺陷。作者构建了 RQ-Bench 基准，基于 arXiv 论文提取作者锚定的研究问题，并与模型生成的问题进行对比。实验发现，LLM 裁判一致高估模型生成问题的新颖性，产生“新颖性幻象”，而领域专家则得出相反结论。此外，模型生成的问题往往狭窄或受限于源材料，LLM 裁判难以察觉。该结果对依赖 LLM 进行科学新颖性评估的可靠性提出严重质疑。

论文 LLM评估科学新颖性 RQ-Bench LLM-as-Judge 研究问题生成

推荐理由：做科学创新评估或使用 LLM 辅助审稿的团队，这篇论文揭示了 LLM 裁判的盲区——它可能高估新颖性，导致误判。建议点开了解 RQ-Bench 的测试方法，避免在关键评估中踩坑。

原文

12:10

arXiv cs.AI@Zixuan Xiao, Pei Troh Koh, Jun Ma, Jack C. P. Cheng

精选

建筑信息模型（BIM）中几何密集型规范的合规检查自动化长期受限于高层法规逻辑与结构化IFC数据之间的语义鸿沟。现有方法依赖静态规则模板，难以处理多跳推理链或跨实体的空间依赖。为此，研究者提出SGR-BIM框架，通过动态构建跨模态知识图谱，将用户意图、法规语义与BIM几何对齐，实现可解释的推理。在679个消防规范专家验证查询上，该框架达到84.3%的准确率，比增强工具的单智能体基线提升8.6%。该研究为AEC行业提供了更透明、灵活的几何合规检查自动化范式。

论文 BIM 合规检查图推理知识图谱 AEC

推荐理由：BIM合规检查的自动化是建筑行业的长期痛点，SGR-BIM用图推理解决了多跳空间依赖问题。做BIM开发或建筑规范自动化的团队，可以直接参考其84.3%准确率的验证结果。

原文

12:09

arXiv cs.LG@Yeongseo Jung, Jaehyeok Kim, Eunseo Jung, Jiachuan Wang, Yongqi Zhang, Ka Chun Cheung, Simon See, Lei Chen

精选

现有对话模型在长对话中因历史累积导致计算冗余和注意力分散，简单截断或摘要会损失信息。研究者提出 C-DIC（Context-Driven Incremental Compression），将对话拆分为可修订的上下文线程，存储紧凑的对话记忆，并通过轻量级检索-修订-回写机制跨轮共享信息、更新过时记忆。该方法还适配了截断反向传播（TBPTT）来学习跨轮依赖，无需完整历史反向传播。实验表明，C-DIC 在数百轮对话中保持稳定的推理延迟和困惑度，为高质量长对话建模提供了可扩展路径。

论文对话系统上下文压缩长对话增量学习 C-DIC

推荐理由：长对话场景（如客服、角色扮演）的开发者终于有了一个兼顾效率与保真度的压缩方案——C-DIC 能稳定处理数百轮对话，值得在长上下文任务中试试。

原文

12:03

arXiv cs.LG@Haoyuan Deng, Yitong Gao, Yudong Lin, Haichao Liu, Zhenyu Wu, Ziwei Wang

精选

真实世界机器人操作中，人类在环强化学习（HiL-RL）依赖频繁人工纠正，成本高且难以扩展。UniIntervene 提出一种智能体干预模型，能自动检测无效探索并引导策略回到高价值状态，大幅减少人工干预。它通过未来条件动作价值估计和时序价值风险评判器，在价值停滞或下降时触发干预，并从记忆库中检索高价值恢复目标生成纠正动作。在多种真实操作任务中，UniIntervene 将平均成功率提升 8.6%，同时减少 57% 的人工干预。这项研究为降低 HiL-RL 部署成本、提升可扩展性提供了新思路。

论文强化学习人机协作机器人操作智能体干预 UniIntervene

推荐理由：做机器人强化学习或人机协作的团队，终于有了减少人工干预的自动化方案——UniIntervene 用价值感知的智能体干预替代频繁人工纠正，成功率还更高，值得在真实场景中一试。

原文

12:02

arXiv cs.LG@Yucheng Li, Huiqiang Jiang, Yang Xu, Jianxin Yang, Yi Zhang, Yizhong Cao, Yuhao Shen, Fan Zhou, Rui Men, Jianwei Zhang, An Yang, Bowen Yu, Bo Zheng, Fei Huang, Junyang Lin, Dayiheng Liu, Jingren Zhou

精选83°

强化学习（RL）训练中，rollout 阶段是主要瓶颈。多 Token 预测（MTP）本可通过推测解码加速，但 RL 训练中 MTP 接受率会因模型熵波动而显著下降。Bebop 研究揭示了熵与接受率的负线性关系，并提出概率拒绝采样可缓解熵干扰。他们进一步提出端到端 TV 损失函数，直接优化拒绝采样接受率，在数学推理、代码生成和智能体任务上实现最高 95% 接受率，吞吐量提升 25%。在 Qwen3.5/3.6/3.7 模型上，异步 RL 训练端到端加速达 1.8 倍，且无需在线更新 MTP。

论文强化学习多 Token 预测推测解码拒绝采样 Qwen

推荐理由：RL 训练加速是 LLM 后训练的核心痛点，Bebop 用 MTP+拒绝采样把加速做到 1.8 倍，做 RL 训练优化的团队可以直接参考其 TV 损失和离线训练策略。

原文

12:00

arXiv cs.LG@Anamaria-Roberta Hartl, Levente Zólyomi, David Stap, Pieter-Jan Hoedt, Niklas Schmidinger, Lukas Hauzenberger, Sebastian Böck, Günter Klambauer, Sepp Hochreiter

精选

该论文系统比较了三种主流子二次架构（xLSTM、Mamba-2、Gated DeltaNet）在复杂任务上的表现，包括代码模型预训练、大模型蒸馏和时序基础模型预训练。结果显示，xLSTM 在所有任务中综合性能最优，其优势源于更灵活稳定的门控机制带来的状态追踪与记忆累积能力。研究通过统一公式分析和合成任务验证，揭示了 xLSTM 在长程依赖建模上的核心机制。

论文 xLSTM Mamba-2 子二次架构序列建模代码预训练

推荐理由：做序列建模或基础模型预训练的团队，这篇论文帮你厘清了 xLSTM 相比 Mamba 等架构的实际优势，看完可以直接指导模型选型。

原文

11:58

arXiv cs.LG@Leon Bergen, Usha Bhalla, Sidharth Baskaran, Max Loeffler, Raphael Sarfati, Dhruvil Gala, Ryan Panwar, Santiago Aranguri, Thomas Fel, Atticus Geiger, Matthew Kowal, Siddharth Boppana, Daniel Balsam, Owen Lewis, Jack Merullo, Thomas McGrath, Ekdeep Singh Lubana

精选

这篇论文提出了一种基于可解释性的后训练数据管道，用于诊断和修正偏好数据中的虚假关联。作者通过可解释性协议识别出数据中潜在的概念，让用户能明确哪些行为应该被模型学习。实验表明，该方法能有效缓解过度风格化、谄媚等不良行为，并增强安全性和个性等期望属性。这项工作将后训练从优化黑箱奖励转变为审计和塑造学习信号的过程。

论文可解释性后训练偏好数据模型对齐数据审计

推荐理由：做模型对齐和偏好优化的团队终于有了数据层面的诊断工具——不用再盲目调奖励权重，直接看数据教了模型什么。做安全对齐或模型人格定制的开发者建议点开，能省下大量试错时间。

原文

11:56

arXiv cs.LG@Mengyu Zheng, Kai Han, Boxun Li, Haiyang Xu, Yuchuan Tian, Wei He, Hang Zhou, Jianyuan Guo, Hailin Hu, Lin Ma, Chao Xu, Guohao Dai, Lixue Xia, Yunchao Wei, Yunhe Wang, Yu Wang

精选

通用智能体（如OpenClaw）在编程任务上的表现难以用现有SWE-bench准确衡量，因为其不满足Docker工作区、补丁和预测合约要求。为此，研究者推出了Claw-SWE-Bench，一个多语言基准测试和适配器协议，能在固定提示、预算、工作区等公平条件下比较不同智能体框架。该基准包含350个GitHub问题实例，覆盖8种语言和43个仓库，并提供了80实例的轻量版Lite用于快速验证。实验显示，OpenClaw在直接适配器下仅得19.1% Pass@1，而完整适配器可达73.4%，表明适配器设计对编程任务至关重要。该基准将框架和成本作为评估核心维度，数据已开源。

论文基准测试编程智能体 OpenClaw SWE-bench 适配器

推荐理由：做智能体编程评估的团队终于有了公平比较的基准——Claw-SWE-Bench解决了不同框架无法直接对比的痛点，建议做Agent评估的开发者直接用它来测试自己的适配器设计。

原文

11:49

rohanpaul_ai@rohanpaul_ai

一项新研究指出，LLM 作为安全裁判时，对同一答案的翻译或改写版本可能给出不同安全判决。问题在于许多 AI 团队依赖 LLM 判断模型回答是否安全，但安全并非简单的二元问题。论文提出压力测试：将相同答案翻译或改写后展示给裁判，检查判决是否一致。裁判在暴力或极端内容等明显有害场景表现较好，但在金融建议、信用评估等依赖上下文和判断的场景中表现脆弱。不同裁判之间分歧大，高原始一致性可能掩盖低真实可靠性。

论文 LLM 安全裁判模型一致性压力测试 arxiv

推荐理由：做 AI 安全评测的团队会直接受影响——你的安全裁判可能比想象中更不可靠，建议点开看看测试方法。

原文

11:30

arXiv cs.AI@Cheng-Yu Yang, Shao-Yuan Lo, Yu-Lun Liu

精选

视觉语言模型（VLM）将图像投影为数百到数千个视觉令牌，导致解码器推理成本高昂。现有方法通常采用“排序并移除”范式，永久丢弃低分令牌。但研究发现，视觉令牌的重要性会随解码器深度变化，早期低分令牌可能在后续层变得重要。为此，研究者提出Reroute，一种无需训练的插件，将移除改为可恢复路由：被延迟的令牌在后续阶段重新进入候选池。该方法在FastV、PDrop等方案上，在LLaVA-1.5和Qwen骨干上，在激进令牌缩减下提升了接地性能，同时保持VQA性能。这表明VLM令牌缩减应视为可恢复路由，而非不可逆修剪。代码已开源。

论文视觉语言模型令牌缩减可恢复路由推理优化开源/仓库

推荐理由：VLM推理成本高是实际部署的痛点，Reroute用零训练代价解决了令牌缩减中信息丢失的问题，做多模态模型优化或部署的团队可以直接集成到现有方案中，值得一试。

原文

11:29

arXiv cs.AI@Steven Oh, Jason Jingzhou Liu, Tony Tao, Philip Han, Kenneth Shaw, Satoshi Funabashi, Ruslan Salakhutdinov, Deepak Pathak

精选

本文提出NEXT方法，通过数据驱动的方式仅用10分钟自由运动数据训练1分钟，即可估计机械臂外部关节力矩，无需专用力传感器。结合FIRST重采样训练策略，在行为克隆中提升接触任务表现，五个长时任务中任务进度提升超17%。该方法让低成本机械臂也能实现力反馈遥操作和策略学习，无需额外硬件。代码和视频已开源。

论文力感知机器人操作行为克隆低成本硬件 NEXT

推荐理由：做机器人操作研究的团队终于有了低成本力感知方案——NEXT仅需10分钟数据就能替代昂贵传感器，FIRST让行为克隆在接触任务中提升17%进度，建议做遥操作或灵巧操作的开发者直接试。

原文

11:28

arXiv cs.AI@Jadelynn Dao, Milan Ganai, Yasmina Abukhadra, Ajay Sridhar, Mozhgan Nasr Azadani, Katie Luo, Clark Barrett, Jiajun Wu, Chelsea Finn, Marco Pavone

精选72°

DIRECT 是一个路由框架，利用多模态场景上下文为每个提示分配测试时计算资源，以改善成功-成本帕累托前沿。研究发现，在链式思维深度、模型大小和记忆历史三个缩放轴上，测试时计算并非均匀杠杆，不同轴带来不同能力增益。在 VLABench 和 RoboMME 上的实验表明，DIRECT 在物理 Franka 机械臂上匹配或超越更强模型的成功率，同时平均延迟降低高达 65%。该工作揭示了朴素缩放测试时计算的浪费性，为具身代理的部署提供了更高效的方案。

论文具身智能测试时计算路由框架 VLM 机器人规划

推荐理由：DIRECT 解决了具身规划中测试时计算资源浪费的问题，做机器人部署和 VLM 应用的团队可以直接参考其路由策略，在降低成本的同时保持性能。

原文

11:27

arXiv cs.AI@Songhao Wu, Ang Lv, Ruobing Xie, Yankai Lin

精选

Mixture-of-Experts (MoE) 模型中的路由器负责决定激活哪些专家，但其设计缺乏理论指导。本文提出将每个路由器行与对应专家的主奇异方向对齐，因为该方向能最有效地描述矩阵。基于此，作者设计了 Manifold Power Iteration (MPI) 方法，采用“先幂迭代再收缩”的范式，使路由器行收敛到专家的主奇异方向。实验在 1B 到 11B 参数的 MoE 模型上验证，该方法显著提升了模型效果。

论文 MoE 路由器设计主奇异方向 Manifold Power Iteration 模型优化

推荐理由：MoE 模型的路由器设计长期缺乏理论依据，MPI 给出了可解释的优化方向，做大规模 MoE 训练的团队值得关注，能直接提升模型效率。

原文

11:21

arXiv cs.AI@Haotao Xie

针对古诗鉴赏任务中领域特定数据集稀缺、通用模型忽视诗歌特性的问题，研究团队构建了包含 49,404 条指令-响应对的 CCPoetry-49K 数据集，覆盖术语解释、语义理解和情感推理三个子任务。基于该数据集，通过 LoRA 微调 Qwen2.5-14B 得到 PoetryQwen 模型，在 CCL25-Eval Task 5 基准上达到 0.757 分，相比基线提升 9.7%。该工作为古诗精准翻译与情感理解提供了专用数据集和优化方法，展示了领域微调的有效性。

论文古诗理解 LoRA微调 Qwen2.5 CCPoetry-49K 领域数据集

推荐理由：做古典文学 NLP 或诗歌 AI 应用的团队终于有了专用数据集和微调方案，PoetryQwen 在翻译和情感理解上提升明显，值得直接参考使用。

原文

11:11

arXiv cs.AI@Zhiyi Chen, Jie Song, Peng Li

精选72°

TAHOE 是一个新型 Text-to-SQL 系统，通过将提示优化视为动态数据管理问题来提升 LLM 的 SQL 生成质量。它利用错误驱动的提示学习管道，在开发和部署阶段将调试痕迹整合到结构化的提示库中，包括语法提示和语义提示。TAHOE 还引入策略层来建模冲突的用户意图，并通过逻辑规划和 SQL 合成指导推理。在 Spider 2.0-Snow 基准测试中，TAHOE 将 GPT-5.5 的通过率从 61.95% 提升至 79.42%，并实现了 100% 的 Snowflake 语法通过率。该提示库还可迁移到更弱的模型，如 Doubao-2.0-lite 上获得 19.7 个百分点的通过率提升。

论文 Text-to-SQL 提示优化 LLM 数据库 GPT-5.5

推荐理由：TAHOE 解决了 Text-to-SQL 从原型到生产部署的痛点——无需微调模型即可大幅提升 SQL 生成准确率，做数据库应用或数据分析的开发者可以直接用这套方法优化现有 LLM 管线。

原文

11:10

arXiv cs.AI@Noémi Éltető, Nathaniel D. Daw, Kimberly L. Stachenfeld, Kevin J. Miller

精选

ATLAS 是一个用于自动化科学发现的主动学习框架，旨在通过数据驱动的方式发现可解释的行为模型。它迭代生成机械论假设（以稀疏神经网络集成形式实现），并设计最优实验来区分这些假设。在强化学习代理恢复任务中，ATLAS 相比随机实验实现了 5-10 倍的样本效率提升，其性能甚至优于专家设计的实验。该框架有望加速认知科学等领域中机械论模型的发现过程。

论文主动学习机械论建模认知科学强化学习稀疏神经网络

推荐理由：ATLAS 解决了科学实验中实验设计效率低下的核心问题，做认知科学或行为建模的研究者可以直接用这个框架加速发现可解释模型，建议点开看看具体实现。

原文

11:09

arXiv cs.AI@Xucong Wang, Ziyu Ma, Yong Wang, Yuxiang Ji, Shidong Yang, Guanhua Chen, Pengkun Wang, Xiangxiang Chu

精选72°

APPO（Agentic Procedural Policy Optimization）是一种新的强化学习方法，旨在改进大语言模型智能体的多轮工具使用能力。传统方法在粗粒度的交互单元（如工具调用边界）上分配信用，难以识别影响最终结果的关键中间决策。APPO通过分支评分（Branching Score）在序列中细粒度地选择分支点，并结合程序级优势缩放（procedure-level advantage scaling）更精确地分配信用。实验表明，APPO在13个基准测试上平均提升近4个百分点，同时保持高效的工具调用和可解释性。这项研究解决了智能体强化学习中信用分配不精确的问题，对开发更可靠、高效的AI智能体具有重要意义。

论文强化学习智能体工具调用信用分配 APPO

推荐理由：做AI智能体强化学习的团队终于有了更精细的信用分配方法——APPO在13个基准上稳定提升4个点，且不牺牲效率，做多轮工具调用优化的开发者值得一试。

原文

11:07

arXiv cs.AI@Duc-Cuong Dang, Andre Opris, Dirk Sudholt

本文首次对 SPEA2 算法中处理支配解的部分进行了运行时分析，发现其在 OneTrapZeroTrap 基准上无法像 NSGA-II 等算法一样高效覆盖帕累托前沿。问题根源在于使用 k 近邻距离进行适应度分配，导致对支配个体的多样性维持不足。为此，作者提出改进版本 SPEA2$^+$，采用所有成对距离进行密度估计，在复杂问题上达到与其他主流算法相同的性能保证，同时在简单问题上保持原算法表现。实验验证了理论分析的正确性。

论文多目标优化进化算法 SPEA2 运行时分析密度估计

推荐理由：多目标优化研究者终于有了 SPEA2 的理论短板分析——原版在支配解处理上存在盲区，SPEA2$^+$ 的改进思路（全距离密度估计）简单有效，做进化算法理论或应用的团队值得关注。

原文

11:06

arXiv cs.AI@Zhi Wei Xu, Torbjörn E. M. Nordling

该论文提出了一种端到端的时空Transformer框架，用于在光照变化条件下通过RGB摄像头远程估计心率（rPPG）。方法结合了3D人脸对齐、光照增强、残差时间标准化模块和混合时频监督，显著提升了机器人环境下的心率估计鲁棒性。在包含三种光照水平的数据集上，该方法将心率平均绝对误差降至0.79 bpm，相关系数达0.982，相比PhysFormer基线误差降低93.6%。这项工作解决了服务机器人在日常光照变化中无法可靠感知用户生理状态的关键问题。

论文 rPPG 心率估计机器人感知 Transformer 光照鲁棒

推荐理由：机器人需要感知用户心率来调整交互策略，但光照变化一直是部署的拦路虎——这个框架把误差压到了1 bpm以内，做服务机器人或辅助机器人开发的团队可以直接参考。

原文

11:04

arXiv cs.AI@Adam Wei, Nicholas Pfaff, Thomas Cohn, Arif Kerem Dayı, Constantinos Daskalakis, Giannis Daras, Russ Tedrake

精选72°

机器人领域的高质量任务数据昂贵且难以收集，而次优数据（低质量或分布外演示）却大量存在。现有方法在同时训练两类数据时，常无法区分次优样本中的有用和有害特征。Ambient Diffusion Policy 通过引入噪声依赖的数据使用策略，仅在高和低扩散时间步利用次优数据，从而提取有用特征。该方法基于机器人动作数据的频谱幂律分布，利用全局到局部层次和局部性两个性质。在六项任务上，针对四种次优数据（噪声轨迹、仿真到现实差距、任务不匹配、大规模数据混合），该方法均有效，并在 Open X-Embodiment 数据集上比现有方法提升高达33%。

论文机器人模仿学习扩散策略次优数据 Open X-Embodiment

推荐理由：机器人团队终于有了一个能高效利用次优数据的实用方法——Ambient Diffusion Policy 解决了低质量数据难以训练的问题，做机器人模仿学习的开发者可以直接在现有数据集上尝试，有望大幅降低数据收集成本。

原文

11:03

arXiv cs.AI@Hui Wang, Tianyu Ren, Joseph Butler, Christopher Baker, Karen Rafferty, Simon McDade

针对生物科学应用中多模态数据常部分缺失的问题，研究者提出Latent World Recovery (LWR)框架。LWR通过将不同模态的嵌入对齐到共享潜在空间，并仅融合实际可用的模态嵌入来构建统一表示，避免了传统缺失模态重构带来的误差传播。该方法无需固定模态集或显式插补缺失数据，在真实多组学基准上对癌症表型分类和生存预测等下游任务表现有效。

论文多模态学习缺失模态潜在空间对齐生物信息学表示学习

推荐理由：做多模态学习或生物信息学研究的团队，LWR解决了缺失模态下的鲁棒表示学习痛点，直接利用可用模态避免误差累积，值得关注其实验结果。

原文

11:02

arXiv cs.AI@Ria Doshi, Tian Gao, Annie Chen, Chelsea Finn, Jeannette Bohg

多机器人协作在移动场景中面临扩展性差和部分可观测性问题。CHORUS框架利用预训练视觉-语言-动作（VLA）模型的视觉运动先验，使每个机器人仅依赖自身局部观测和身份提示即可独立运行，无需推理时通信或显式对齐。在移动测量、图书交接和洗衣篮搬运等真实实验中，CHORUS相比从零训练的分散模型提升64%性能，对队友行为的反应性提高40%，并超越集中式基线。该工作表明，共享VLA骨干网络足以实现去中心化多机器人协作，无需为每个机器人单独训练策略。

论文多机器人协作 VLA模型去中心化机器人预训练

推荐理由：多机器人协作的扩展性难题被VLA模型破解了——做机器人集群部署的团队可以直接参考CHORUS的零通信方案，省去复杂的对齐和通信模块。

原文

11:01

arXiv: DeepSeek@Hao Xiang, Qiaoyu Tang, Le Yu, Yaojie Lu, Xianpei Han, Ben He, Le Sun, Bowen Yu, Peng Wang, Hongyu Lin, Dayiheng Liu

精选

RACES 提出一种递归自动组合框架，将可验证环境视为可组合的积木块，通过定义 SEQUENTIAL、PARALLEL、SORT、SELECT 等组合算子，自动融合环境以生成多样化的推理模式。实验表明，基于组合环境的强化学习训练能持续提升推理泛化能力：在 6 个未见基准上，DeepSeek-R1-Distill-Qwen-14B 平均提升 3.1 分，Qwen3-14B 从 58.8 提升至 61.1。仅用 50 个基础环境即可达到 300 个独立环境的训练效果，显著提高环境利用效率。该方法解决了手动构建环境线性扩展的瓶颈，为 LLM 推理能力扩展提供了可扩展的新路径。

论文推理模型强化学习环境组合泛化能力 RACES

推荐理由：做 LLM 推理强化学习的团队终于有了可扩展的环境构建方案——RACES 用递归组合替代手动堆叠，效率提升 6 倍，值得关注其开源实现。

原文

11:00

arXiv cs.AI@Maria Edwards, Julian Togelius

该研究通过一个游戏化写作实验，探讨人类在AI辅助创作中何时会采纳AI建议，以及这对个人创造力的影响。74名参与者（214份回复）在写作时可以看到AI生成的单词建议，但游戏设定在一个反乌托邦未来，AI试图学习人类个性，因此明确禁止使用AI建议。实验通过反向设计“乐于助人的助手”模式，揭示用户真实偏好而非默认行为。分析聚焦于用户在不同任务类型中保持创意自主与违反规则接受AI帮助的行为模式。该游戏化方法为研究真实人机交互及效率与真实性之间的张力提供了新视角。

论文人机协作创意写作游戏化实验 AI建议用户行为

推荐理由：这项研究用游戏机制戳破了AI辅助创作中“默认接受”的假象，做创意工具或人机交互设计的团队值得一看，能帮你理解用户何时会主动拒绝AI建议。

原文

10:59

arXiv cs.AI@Kai Standvoss, Miriam Hägele, Rosemarie Krupar, Julika Ribbat-Idel, Jennifer Altschüler, Gerrit Erdmann, Hans Pinckaers, Evelyn Ramberger, Madleen Drinkwitz, Ádám Nárai, Alexander Möllers, Katja Lingelbach, Sebastian Kons, Lukas Hönig, Recepcan Adigüzel, Joana Baião, Alberto Megina Gonzalo, Marius Teodorescu, Marie-Lisa Eich, Paolo Chetta, Shakil Merchant, Verena Aumiller, Simon Schallenberg, Andrew Norgan, Klaus-Robert Müller, Lukas Ruff, Maximilian Alber, Frederick Klauschen

精选

Atlas H&E-TME 是一个基于 Atlas 病理基础模型的 AI 系统，能够从 H&E 染色的全切片图像中预测组织质量、区域和细胞类型，每张切片输出超过 4500 个细胞级定量指标。研究团队提出了双重验证框架：一方面利用免疫组化（IHC）信息构建多病理学家共识，作为分子层面的金标准；另一方面在超过 20 万条高置信度病理学家标注上测试，覆盖 8 种癌症类型、1500+ 病例。结果显示，Atlas H&E-TME 在 H&E 图像上的表现与病理学家相当甚至更优，且泛化能力强。这一系统将最普遍的 H&E 切片转化为可扩展的定量工具，为下一代组织生物标志物研究奠定基础。

论文病理AI H&E染色组织分析基础模型肿瘤微环境

推荐理由：病理分析终于有了可规模化的 AI 方案——Atlas H&E-TME 在 H&E 图像上达到专家级精度，做肿瘤微环境研究和临床转化的团队可以直接用上这套定量工具。

原文

10:55

arXiv cs.AI@Krti Tallam

精选

企业安全传统上围绕数据边界构建，但生产级AI智能体打破了这一假设——它们代表企业读取上下文、调用工具、修改系统记录，风险从边界转移到了工作流内部。现有策略引擎无法处理这种状态化、复合主体的授权链场景。本文提出一个五平面参考架构：一个推理平面裁决意图，四个执行平面（网络、身份、端点、数据）实现决策，支持任意点中断、复合主体能力衰减和结构化审计。该架构定义了六种中断原语、四个正确性不变量，并在五个具体工作流中演示了七种生产威胁的防范。参考实现显示：裁决在个位数微秒内完成，审计底层的防篡改行为符合设计预期。

论文 AI智能体安全治理参考架构企业安全运行时治理

推荐理由：生产级AI智能体面临的安全治理空白终于有了系统化的架构方案——做AI Agent部署、企业安全架构的团队可以直接参考这个五平面模型来设计自己的治理层，建议点开看看具体的中断原语和正确性证明。

原文

10:53

arXiv cs.AI@Sukmin Seo, Geewook Kim

精选

该研究指出，在小时级长视频中，自然语言时间定位（Temporal Grounding）的核心瓶颈是搜索而非识别。现有视频大模型（Video-LLMs）在短片上表现良好，但在小时级视频中因无法高效搜索相关区域而崩溃。作者发布了首个开放域小时级时间定位基准 ExtremeWhenBench（194个视频，平均75.7分钟，最长9小时，2273条查询），发现所有开源 Video-LLM 均不如简单的帧级检索基线。失败分析显示85%的错误源于搜索失败，而“检索-定位”混合方法比单一 Video-LLM 提升6.7倍，类似于开放域问答中的“检索-阅读”范式。

论文时间定位长视频理解检索-定位 Video-LLM 基准测试

推荐理由：做长视频理解或视频检索的开发者会发现，当前 Video-LLM 在小时级视频上几乎不可用，而简单的检索基线反而更有效——这个反直觉结论值得点开看看，或许能帮你重新设计系统架构。

原文

10:11

arXiv cs.LG@Chirag Chawla, Pratinav Seth, Vinay Kumar Sankarapu

精选

ALIGNBEAM 是一种无需训练的推理时安全对齐方法，解决了领域微调导致大语言模型安全性下降的问题。现有方法要求安全锚点模型和目标模型共享词汇表，但 ALIGNBEAM 通过逐 token 翻译锚点 logits 到目标模型词汇表，并利用小型 LLM 法官选择最安全的候选续写，突破了这一限制。该方法不改变任何模型权重，可在部署时调整安全-效用权衡。在跨词汇表和同词汇表评估中，ALIGNBEAM 显著提升了对抗性基准的拒绝率，同时保持任务准确性和推理开销在实用范围内。结果表明，安全对齐可以在推理时在不同模型家族之间转移，无需修改任何模型权重。

论文安全对齐推理时防御跨词汇表 LLM ALIGNBEAM

推荐理由：做模型安全对齐的团队终于有了跨家族迁移方案——ALIGNBEAM 无需训练即可在推理时转移安全能力，适合需要部署不同系列模型但担心安全退化的开发者直接尝试。

原文

10:10

arXiv cs.LG@Zhen Zhang, Alessandro Alla, George Em Karniadakis

精选

该研究对偏微分方程约束逆问题中的伴随优化方法和物理信息神经网络进行了公平对比。通过统一抽象公式、匹配优化器、参数化及精度，在多个基准测试（如非稳态Burgers方程、噪声Darcy渗透率反演、三维Allen-Cahn反应识别、非稳态Navier-Stokes粘度识别）中评估两者性能。结果表明，未知参数的表示形式决定方法优劣：网格基场适合离散伴随，而神经表示是PINN的天然优势。对于时间依赖问题，伴随方法受轨迹存储和微分成本制约，而PINN能以更低成本获得满意重建。PINN热启动伴随策略能以大幅降低的成本恢复伴随级精度。

论文伴随方法物理信息神经网络 PDE约束逆问题计算力学基准测试

推荐理由：做计算力学和逆问题研究的团队，这篇论文帮你省去选择方法的纠结——它给出了伴随法和PINN在不同场景下的明确优劣边界，看完可以直接指导你的实验设计。

原文

10:08

arXiv cs.LG@Balázs Gyenes, Emiliyan Gospodinov, Jan Frieling, Enrico Krohmer, Nicolas Schreiber, Xiaogang Jia, Niklas Freymuth, Gerhard Neumann

精选

该研究提出将点云从笛卡尔空间映射到高维傅里叶空间，以解决神经网络在模仿学习中难以学习高频空间特征的问题。在 RoboCasa 和 ManiSkill3 基准测试以及真实机器人实验中，傅里叶特征显著提升了基于点云的策略在精细操控任务上的表现。该方法简单、鲁棒，且适用于多种编码器架构，有望成为点云模仿学习的通用工具。

论文模仿学习机器人操控点云傅里叶特征高频空间

推荐理由：做机器人操控和模仿学习的团队值得关注——傅里叶特征解决了神经网络对低频偏好的固有问题，让你在点云策略上直接获得高精度提升，代码和视频已开源，可以直接上手试。

原文

10:07

arXiv cs.LG@Paul He, Shiva Kasiviswanathan, Dominik Janzing

该研究提出了一种基于信息论的多轮对话语义进展度量方法，通过计算对话中问题相关且非冗余信息的累积量来评估对话质量。核心指标使用高斯模型在嵌入空间中近似不确定性减少，具有单调性、可加分解和冗余证据递减等理论性质。实验表明，该方法在MT-Bench、Chatbot Arena和UltraFeedback上与人类判断高度一致，甚至优于部分基于LLM的评判方法。该指标无需自回归推理，仅需轻量级嵌入模型即可在CPU上运行，显著降低了评估成本。

论文多轮对话语义进展信息增益评估指标嵌入模型

推荐理由：做对话系统评估的团队终于有了一个可复现、低成本的替代方案——无需调用大模型就能衡量对话的语义进展，建议做客服或问答系统的开发者试试这个指标。

原文

10:06

arXiv cs.LG@Minghui Yang, Ling Guo, Liu Yang

神经算子模型在函数空间映射上表现良好，但泛化到其他算子时通常需要微调或重新训练。In-Context Operator Networks (ICON) 通过数值上下文提示让模型学习特定算子，无需微调即可适应不同算子，但在分布外任务上仍可能失败。受大语言模型链式提示的启发，研究者提出 Chain of Operators (CHOP) 框架，通过构建由显式初等变换和冻结的 ICON 组成的算子链，在不更新参数的情况下提升 ICON 在分布外任务上的泛化能力。在标量守恒律和平均场控制问题上的实验表明，CHOP 相比直接 ICON 评估降低了相对推理误差，且链中每个算子保持可解释和封闭形式。在一个 PDE 族上构建的链还能泛化到不同族，表明跨系统存在共享机制。

论文神经算子 ICON Chain of Operators 泛化 PDE

推荐理由：CHOP 解决了神经算子模型在分布外任务上泛化差的痛点，做科学计算或 PDE 求解的团队可以直接用这个框架提升模型效果，无需重新训练。

原文

10:05

arXiv cs.LG@Hyun Joe Jeong, Gokul Swamy, Andrea Bajcsy

精选

该研究提出一种框架，通过交互式搜索语言序列来提升视觉-语言-动作（VLA）模型的闭环任务性能，并蒸馏为测试时的语言反馈策略（LFP）。同时学习一个改进头，预测何时语言引导能提升性能，并通过保形化处理防止有害干预。该方法适用于任意冻结的预训练VLA模型，无需访问原始训练数据或微调。在模拟和硬件实验中，该策略分别将基础VLA性能提升24.7%和65.0%，且在视觉和语义扰动下具有强无害性保证。

论文 VLA模型语言引导机器人控制保形预测安全干预

推荐理由：机器人开发者终于有了一个无需重新训练就能安全引导VLA模型的方法——通过语言反馈策略提升任务成功率，同时避免有害行为。做机器人控制或人机交互的团队可以直接在现有模型上尝试，值得关注。

原文

10:04

arXiv cs.LG@Pietro Barbiero, Giovanni De Felice, Mateo Espinosa Zarlenga, Francesco Giannini, Filippo Bonchi, Mateja Jamnik, Giuseppe Marra, Ruggero Noris

精选

随着AI模型日益复杂，可解释性成为理解、调试和控制模型的关键工具，但该领域缺乏通用理论来演绎设计可解释方法，导致文献碎片化和评估标准不一致。为此，研究者提出了标准可解释模型（SIM），这是一种基于拉格朗日力学的通用理论，能从用户对可解释性的前提假设出发，系统推导出对称性和约束，进而构建拉格朗日函数，其最小值对应最优可解释模型。通过调整不透明模型参数或编译约束到可解释架构，可达到最小值。实验表明，SIM能识别并解决传统、概念和机制可解释性方法的局限性，揭示未充分探索的研究方向，并指导核心编程接口设计。该理论还为可解释性课程提供教学基础，有望改变该领域长期碎片化的现状。

论文可解释性拉格朗日力学通用理论机器学习 SIM

推荐理由：做可解释性研究的团队终于有了一个统一的理论框架，能系统设计方法而非拼凑碎片，建议关注论文中的对称性和约束推导部分。

原文

10:03