全部 AI 动态 · AI 热点

6月9日

12:32

arXiv cs.LG@Kyungeun Kim, Amanuel Anteneh, Israel Klich, Olivier Pfister, J. M. Schwarz

精选

研究人员提出了一种名为Perturbative Contrastive Physical Learning (PCPL) 的通用框架，让物理系统能够通过对比不同条件下的响应来学习，无需外部处理器或显式反向传播。PCPL统一并扩展了平衡传播和频率传播等方法，通过测量物理状态之间的对比来驱动参数更新。该框架在弹簧网络和连续变量光子电路两种平台上成功演示了分类和模拟乘法任务。这一进展为构建更自主的物理学习系统迈出了重要一步。

论文物理学习 PCPL 反向传播替代平衡传播光子计算

推荐理由：PCPL 让物理系统自己学会学习，做物理计算或类脑计算的团队值得关注——它可能开启无需数字芯片的自主训练新范式。

原文

12:30

arXiv cs.LG@Seongbin Park, Fan Zhang, Baharan Mirzasoleiman, Shahriar Talebi, Nader Sehatbakhsh

精选

VLA模型在机器人操作任务中表现出色，但无法保证避免与任务无关物体的碰撞。现有安全过滤器通过查询VLM来识别障碍物，但速度太慢，无法在控制循环中实时运行。研究发现，VLA模型中的少数注意力头能可靠定位策略意图接近的目标物体。利用这些注意力头，可以在无需训练的情况下，每步获取活动目标，将场景其余部分视为障碍物，并输入控制障碍函数过滤器。结合轻量级实时目标跟踪器，该方法能有效避免非静态障碍物的碰撞，在动态场景中比使用模拟器特权状态的Oracle方法平均提升43%。

论文 VLA模型安全过滤器注意力机制控制障碍函数机器人操作

推荐理由：做机器人安全控制的团队终于有了一个轻量级方案——VLA模型自带的注意力头就能当安全过滤器用，无需额外训练或重模型，动态场景效果还更好，值得点开看实现细节。

原文

12:29

arXiv cs.LG@Rishabh Sabharwal, Hongru Wang, Amos Storkey, Jeff Z. Pan

精选

现有深度研究智能体（DRA）基准仅评估单次输出，忽略了反馈改进能力。研究者设计了多轮评估框架，对比自我反思和过程级反馈两种场景。过程级反馈通过研究缺口推断（RGI）方法，分析评分标准满足模式来指导改进。实验发现：自我反思几乎无净改进；单轮过程级反馈可提升8-15分，但多轮改进效果不叠加，因为重写时可能丢失已满足标准。这表明即使有针对性指导，DRA的可靠多轮改进仍具挑战。代码和结果已开源。

论文深度研究智能体多轮评估过程级反馈 RGI方法开源/仓库

推荐理由：做AI研究助手或智能体评估的团队，这篇论文揭示了当前DRA在多轮反馈下的真实瓶颈——单轮有效但多轮难持续，值得点开看具体实验设计和RGI方法。

原文

12:28

arXiv cs.LG@Sherwin Varghese, Matthew Wicker, Alessio Lomuscio

精选

随着AI在安全关键系统中的部署，形式化鲁棒性保证变得至关重要。现有验证方法要么过于保守，要么计算成本高昂。本文提出STBP（时空边界传播）框架，针对处理视频和体积输入的3D CNN，通过建模真实的时空约束（如攻击者只能修改连续帧中的子集或补丁）来获得更紧的近似。STBP对第一卷积层计算精确闭式解，后续层使用可扩展近似，在UCF-101、Udacity和MedMNIST等基准上实现了1.7倍更高的认证鲁棒准确率。同时，作者发布了ST-Bench基准，用于系统评估自动驾驶和活动识别中的可验证鲁棒性。

论文鲁棒性验证时空神经网络 3D CNN 形式化验证安全关键系统

推荐理由：做AI安全验证的团队终于有了兼顾精度和效率的方案——STBP用混合策略解决了传统方法要么太松要么太慢的困境，做视频/3D视觉鲁棒性验证的开发者可以直接参考。

原文

12:27

arXiv cs.LG@Claudio Nordio

精选

该研究探讨了具有固定读出层和二次损失的前馈ReLU网络，旨在将梯度下降重写为训练集空间上定义的场的集体动力学，而非权重空间的动力学。对于单隐层网络，可以从激活动力学中消除权重变量，得到残差的封闭方程，该方程由输入几何矩阵和动态共激活矩阵分解的集体核控制。对于更深网络，残差动力学保留了清晰的层级核结构，但从三层深度开始，封闭需要一组权重诱导的Gram算子层次结构来跨层传输信息。这项工作为理解深度网络的学习动态提供了新的理论视角。

论文深度学习理论学习动力学 Gram度量 ReLU网络梯度下降

推荐理由：该研究为深度网络学习动力学提供了新的理论框架，做深度学习理论或理解网络内部机制的读者可以直接参考其层级Gram度量方法。

原文

12:26

arXiv cs.LG@Brian Coyle, Snehal Raj, Virag Umathe, El Amine Cherrat, Elham Kashefi

精选

训练参数化量子电路（PQC）时，梯度估计的测量成本是主要瓶颈，传统参数平移规则的成本随参数数量线性增长。本文提出基于前向自动微分的梯度估计框架，通过平均可调数量的随机方向导数获得无偏梯度，并统一了SPSA、随机坐标下降和参数平移规则。在此框架下，作者推导出QUIVER（量子迭代V自适应估计规则）优化器，实现最小测量成本分配。数值实验表明，前向梯度在训练含60量子比特、1770参数的量子神经网络时，效率比参数平移规则高出数个数量级。QUIVER在量子近似优化算法和变分量子本征求解器任务上，也优于iCANS和gCANS等测量节俭优化器。

论文量子机器学习参数化量子电路梯度估计 QUIVER 优化器

推荐理由：量子机器学习团队终于有了一个能大幅降低测量成本的梯度估计框架——QUIVER在60量子比特规模上效率提升数个数量级，做量子电路优化的研究者可以直接用。

原文

12:12

arXiv cs.LG@Chenxiao Yang, Nathan Srebro, Zhiyuan Li

精选

该论文严格刻画了深度L、总参数W的Transformer的VC维，上界为O(L W log(T W))，下界为Ω(L W log(T W / L))，其中T为输入序列长度。进一步，论文给出了思维链学习（chain-of-thought）的样本复杂度紧界：教师强制（teacher forcing）方法需要O(L W log((T+T')W))个样本，而任何利用思维链数据的学习规则至少需要Ω(L W log((T+T')W / L))个样本，T'为自回归步数。这些结果首次为Transformer的泛化能力提供了理论保证，对理解大模型的数据效率有重要意义。

论文 Transformer VC维样本复杂度思维链泛化理论

推荐理由：理论研究者终于有了Transformer样本复杂度的紧界——VC维和思维链学习的下界都算清楚了，做深度学习理论的团队值得细读。

原文

12:11

arXiv cs.LG@Jhonny J. Velasquez Olivera, Christo K. Thomas, Walid Saad

精选

该论文提出了一种基于全息简化表示（HRR）的无监督解耦学习方法，将解耦视为符号结构而非连续表示。通过HRR的“解绑”操作，模型能分离数据中的变化因子，并在潜在遍历和解耦指标上达到与基线相当的性能。理论分析证明解绑操作能产生近似独立的符号-值对，并给出了每个槽位的容量界限。与标准自编码器不同，该方法的潜在单元是向量求和而非标量维度，且对噪声更鲁棒。这项工作为神经解耦提供了新的符号化视角和理论支撑。

论文解耦学习全息简化表示无监督学习符号表示信息论

推荐理由：解耦是机器学习长期难题，这篇用全息简化表示把离散符号结构引入神经网络，做无监督学习的团队值得关注——它既保持了可微分性，又比连续表示更抗噪，理论分析也扎实。

原文

11:57

arXiv cs.AI@Boshu Lei, Kostas Daniilidis, Antonio Loquercio

精选

本文提出 RLDT（Reinforcement Learning with Density Transport），一种在线强化学习算法，用于微调连续控制问题中的流匹配策略。核心思想是将策略改进视为动作密度向高奖励区域的传输，与流匹配模型的传输公式自然对齐。RLDT 使用 Stein 变分梯度下降（SVGD）从最大熵 RL 目标构建传输场，然后微调预训练的流匹配策略以对齐该场。通过预期目标估计近似中间去噪步骤的动作，避免了不稳定的反向传播。实验表明，RLDT 在奖励质量和收敛速度上优于基线，适用于密集/稀疏奖励及基于状态/视觉的长期机器人操作任务。

论文强化学习流匹配密度传输连续控制机器人操作

推荐理由：RLDT 解决了流匹配策略在强化学习中难以微调的痛点，做连续控制或机器人操作的团队可以直接参考其密度传输思路，比蒸馏或近似分布的方法更高效。

原文

11:56

arXiv cs.AI@Peiliang Gong, Emadeldeen Eldele, Chenyu Liu, Ziyu Jia, Yi Ding, Xinliang Zhou, Lianchao Gu, Qi Zhu, Yang Liu, Daoqiang Zhang, Xiaoli Li

精选

现有LLM时间序列预测方法多依赖被动对齐或静态重编程，难以捕捉非平稳模式和细粒度任务意图。本文提出InA-Probe，通过多层级指令注入和自适应查询生成，让模型主动探测时间序列中的关键模式。该方法在7个真实基准上超越现有深度学习和LLM基线，在跨域场景中预测误差降低高达37%，零样本泛化能力也显著提升。消融实验表明，自适应查询与细粒度指令的协同作用是释放LLM推理能力的关键。

论文时间序列预测 LLM 指令感知主动探测零样本泛化

推荐理由：时间序列预测从业者终于有了一个能主动理解任务意图的LLM方案——InA-Probe在跨域场景误差降低37%，做金融、能源等时序预测的团队值得关注。

原文

11:55

arXiv cs.AI@Beiwen Zhang, Yongheng Liang, Guowei Zou, Haitao Wang, Hejun Wu

精选

研究者提出Collaboration Policy Tree (Co-pi-tree)，一种将大语言模型推理蒸馏为可执行策略树的方法，用于人机协作。该方法包含伙伴行为预测树和智能体动作选择树，通过闭环交互反馈自动改进策略分支。在Overcooked-AI实验中，Co-pi-tree相比基线平均奖励提升35.4%，同时将LLM查询次数减少77.7%，测试延迟降低97.1%。这解决了传统多智能体强化学习缺乏可解释性、以及直接使用LLM决策成本高的问题。

论文人机协作策略树 LLM蒸馏可解释AI Overcooked-AI

推荐理由：做AI协作系统或人机交互研究的团队值得关注——Co-pi-tree用可解释的策略树替代黑箱模型，既提升性能又大幅降低推理成本，实验数据很有说服力。

原文

11:53

arXiv cs.AI@Dohwan Kim, Jung-Woo Choi

精选

多通道语音分离的判别模型在参考指标上表现优异，但人类听觉质量欠佳。为此，研究者提出基于MeanFlow的一步生成式校正器MeCo，通过学习条件平均速度场，将判别模型输出直接映射到干净语音流形。MeCo引入数据空间优化（DSO），结合长位移惩罚的生成目标和端点SI-SDR损失，在单步生成中同时提升信号保真度和听觉质量。实验表明，MeCo在域内和域外场景均达到最先进性能，且计算开销极小。

论文语音分离生成式校正 MeanFlow 多通道信号保真度

推荐理由：语音分离的听觉质量一直是痛点，MeCo用一步生成解决了判别模型“指标好但听着差”的问题，做语音增强或分离的团队可以直接在现有模型上叠加使用，值得一试。

原文

11:52

arXiv cs.AI@Wesley Pegden

精选

Trellis 是一个自动形式化系统，利用 LLM 智能体在确定性约束的工作流中，通过迭代优化自然语言证明，逐步推进 Lean 自动形式化任务。该系统受数学家对“严谨证明”的直觉启发——即证明的任何部分都可以被进一步详细阐述。Trellis 在有限预算下使用通用智能体实现了可靠的自动形式化，其专业化来自“严谨性”含义驱动的工作流，而非特定任务训练。论文还展示了该系统生成的 Ramsey 理论最新突破的端到端 Lean 形式化证明。

论文自动形式化 Lean LLM智能体定理证明工作流

推荐理由：Trellis 解决了自动形式化中可靠性与成本之间的平衡问题，做定理证明或形式化验证的开发者可以直接用这个工作流来生成 Lean 证明，值得关注其开源实现。

原文

11:49

arXiv cs.AI@Mateo Diaz-Bone, Daniel Caraballo, Florian Scheidegger, Thomas Frick, Mattia Rigotti, Andrea Bartezzaghi, Roy Assaf, Niccolo Avogaro, Yagmur G. Cinar, Brown Ebouky, Filip M. Janicki, Piotr S. Kluska, Cezary Skura, Cristiano Malossi

精选

现有异常检测方法在 MVTec 等标准数据集上表现完美，但在真实场景中因物体尺度、视角、背景、光照等变化而失效。该研究提出三项创新：视觉提示管道通过前景-背景掩码隔离物体；在师生模型中解冻教师以提升领域适应性；利用扩散生成合成图像增强数据。基于 Masked Multiscale Reconstruction (MMR) 骨干，该方法在挑战性数据集 AeBAD 上比之前最优方法提升 3.5 个百分点。

论文异常检测视觉提示双教师监督扩散模型 AeBAD

推荐理由：做工业视觉异常检测的团队终于有了应对真实场景变化的方案——视觉提示和双教师监督直接解决了传统方法对背景、视角敏感的痛点，值得在产线上试跑。

原文

11:48

arXiv cs.AI@Hongcheng Gao, Hailong Qu, Jingyi Tang, Jiahao Wang, Zihao Huang, Hengkang Qiao, Shihong Huang, Junming Yang, Yi Li, Hongyixuan Yuan, Wenjie Li, Bohan Zeng, Wenbo Li, Bo Wang, Jianhui Liu, Olive Huang, Haoyang Huang, Wentao Zhang, Guoqing Huang, Nan Duan, Yinpeng Dong

精选

多模态大模型在物理世界中的空间推理能力至关重要，但现有基准多依赖静态问答或特定模拟器，无法评估真实交互场景。研究者提出SpatialWorld，一个统一基准，整合8种异构仿真后端，包含760个人工标注任务，覆盖家务、旅行、社交协作等领域。智能体需在仅视觉部分可观测条件下主动收集证据，并通过统一文本接口做出决策。评估15个先进智能体发现，最强模型GPT-5平均任务成功率仅17.4%，开源模型Qwen-3.5为14.1%，表明主动探索和长程规划仍是瓶颈。

论文空间推理多模态大模型基准测试智能体仿真环境

推荐理由：做多模态智能体或空间推理研究的团队，这个基准直接暴露了当前模型在真实交互任务上的短板——GPT-5都只有17.4%成功率，值得用来检验自家模型。

原文

11:46

arXiv cs.AI@Djawad Bekkoucha, Abdelkader Ouali, Bruno Crémilleux

本文提出CFips，一种在用户定义语法约束下采样区间模式的新方法。传统穷举模式挖掘在大模式空间中效率低下，而CFips通过多步采样框架，将约束直接融入采样过程，并分解为区间边界的原子谓词，同时保持精确采样保证。理论证明CFips能按频率比例采样区间模式，实验表明集成约束后能完成超时情况下无法完成的挖掘任务。该方法为模式挖掘提供了高效且可定制的替代方案。

论文模式挖掘区间模式约束采样 CFips 频率采样

推荐理由：做模式挖掘或数据分析的团队，如果常被大模式空间的穷举搜索卡住，CFips的约束采样能直接提升效率——建议做频繁模式相关研究的点开看看。

原文

11:45

arXiv cs.AI@Dun Li, Jiatao Li, Hongzhi Li

精选

这篇论文提出了 MetaAI 递归自设计的操作化证据框架，包含四个标准：可检查的目标系统、元级修改器、反馈导向选择和递归延续。作者将 DGM、STOP、Goedel Agent 和 ShinkaEvolve 等公开系统映射到该框架上，其中 DGM 提供了最直接的证据：经过 80 次迭代，SWE-bench Verified 从 20% 提升到 50%，Polyglot 从 14.2% 提升到 30.7%。消融实验表明开放探索和自我改进都有贡献。论文还提供了 MetaAI-Mini，一个基于 HumanEval 的可复现协议和代码库，但目前尚未包含完整模型运行结果。这项工作为 AI 自我改进提供了系统化的评估方法。

论文递归自设计 MetaAI DGM SWE-bench 可复现性

推荐理由：做 AI 自我改进研究的团队终于有了可对照的评估框架——DGM 的 80 轮迭代提升数据值得参考，建议用 MetaAI-Mini 协议复现验证。

原文

11:44

arXiv cs.LG@Suraj Biswas, Saurabh Gupta, Pritam Mukherjee

精选

研究发现，预训练的生物医学语言模型（如BioBERT、PubMedBERT）在跨领域概念对（如“皮质醇28 ug/dL”与“股市波动性”）上给出高达0.83的余弦相似度，而正确答案应接近零。这种虚假相关性在大型行为模型（LBM）中会导致错误的因果边，进而污染下游推理。研究者提出对比学习方案：第一轮对比训练将PubMedBERT的BIOSSES相关性从0.633提升至0.828，跨领域分离度从1.05倍提升至1.63倍；第二轮BODHI方法通过挖掘知识图谱中的硬负例，将分离度提升至2.30倍，判别差距提升至+0.392。在Intel Xeon 6737P上，OpenVINO将单查询延迟从1367毫秒降至10毫秒（133倍加速），每秒可处理555个句子。研究还发现FP16在该芯片上优于INT8，并解释了原因。

论文因果发现嵌入相似度对比学习生物医学模型 OpenVINO

推荐理由：做因果推断或行为建模的团队会发现，嵌入相似度直接当因果用是危险的——这篇给出了可落地的对比学习方案，还附带了加速脚本，值得直接试。

原文

11:42

arXiv cs.LG@Yinyu Huang, Yilin Zhang, Sofia Michopoulou, Christopher Kipps, Rahman Attar

精选

阿尔茨海默病进展高度异质且数据稀疏不规则，现有机器学习方法多聚焦静态分类或群体风险估计，缺乏个体化建模和不确定性推理。该研究提出一种个性化数字孪生框架，整合互补建模策略捕捉临床转换和时间依赖，利用ADNI数据集预测认知状态和诊断类别，并量化预测不确定性。评估显示，基于相邻访视的转换建模比序列建模预测精度更高，表明局部转换建模在数据稀疏场景下更高效。该框架支持患者特异性“what-if”轨迹分析，为神经退行性疾病的个性化预测提供了实用且可解释的方法。

论文数字孪生阿尔茨海默病稀疏纵向数据个性化预测 ADNI

推荐理由：AD 研究者终于有了一个能处理稀疏数据、支持个性化轨迹预测的工具——做疾病建模或临床试验设计的团队可以直接用这个框架做 scenario 分析，比传统群体模型更贴近真实临床场景。

原文

11:41

arXiv cs.LG@Seoungbin Bae, Dabeen Lee

精选

本文针对上下文队列调度问题，提出CQB-η-2算法，将队列长度遗憾从O(T^{-1/4})提升至O(T^{-1/2})，达到理论最优。算法分为三个阶段：纯随机探索构建初始估计、η随机探索结合UCB规则维持负漂移、纯UCB决策。关键创新在于仅在截止轮前进行随机探索，之后利用已积累样本进行确定性调度。作者还证明了Ω(T^{-1/2})的极小化下界，表明该算法在T的依赖上达到最优。

论文队列调度上下文赌博机遗憾率 UCB 随机探索

推荐理由：调度算法研究者可以关注这个将队列长度遗憾率提升至理论最优的成果，CQB-η-2的三阶段设计思路值得借鉴。

原文

11:39

arXiv cs.LG@Tuan A. Vu, Harri Lähdesmäki, Julien Martinelli

精选

潜空间贝叶斯优化（LSBO）用于分子和蛋白质等结构化对象的设计，但现有上下文学习模型（如TabPFN）在LSBO中存在任务不匹配问题：它们预训练于标准回归任务，而LSBO中潜码到目标值的映射差异显著。研究者提出通过分子VAE的潜空间合成优化任务对表格基础模型进行持续预训练，并加入正则化项保持原始回归先验。在分子优化基准上，该模型表现强劲，验证了LSBO特定适配对上下文代理的重要性。这项工作为AI驱动的分子设计提供了更高效的优化方法。

论文贝叶斯优化潜空间优化分子设计上下文学习 TabPFN

推荐理由：做分子设计或材料优化的团队终于有了适配LSBO的上下文学习代理——它解决了预训练任务与潜空间优化不匹配的痛点，直接提升分子优化效率，建议做AI制药或计算化学的开发者试试。

原文

11:36

arXiv cs.LG@Grégoire Dhimoïla, Victor Boutin, Agustin Martin Picard, Thomas Fel, Thomas Serre

精选

本文提出一个统一框架，将概念对齐分解为“对齐什么”（表征 vs 概念）和“对齐层级”（实例级 vs 分布级）两个维度，从而定义四种属性。作者发现现有方法常混淆这些属性，优化一个目标并不能可靠恢复其他目标。他们引入 InterVenchA 基准来独立测量提取质量、翻译质量和概念一致性。最后提出 CoSAE（耦合稀疏自编码器），联合强制执行互补的对齐目标，仅需 0.1% 配对数据即可在分布目标锚定下恢复实例级对齐。这项工作表明概念对齐本质上是多目标优化问题，需要明确定义、测量和优化。

论文表征对齐概念分解稀疏自编码器多目标优化可解释性

推荐理由：做表征对齐、多模态学习或可解释性研究的团队，这篇论文把概念对齐的混乱局面理清了——CoSAE 用极少量配对数据就能实现强对齐，值得直接复现试试。

原文

11:32

arXiv cs.LG@Siyu Lou, Hao Xu, Wenguan Wang, Lu Lu, Hao Sun, Yang Liu, Linfeng Zhang, Dongxiao Zhang, Yuntian Chen

精选

这篇综述论文提出了一个面向问题的视角来理解数据驱动微分方程发现领域。作者首先引入了一个二维相图，根据结构复杂度和系数复杂度对发现问题进行组织，展示了该领域如何从发现稀疏方程发展到更复杂的物理定律。然后提出了表示-评估-优化（REO）框架作为发现过程的基本抽象，将讨论从具体算法转向决定可发现性的基本原则。论文还讨论了这些视角在物理学及相关科学中的应用，并指出下一个挑战不仅是恢复方程，而是利用它们修正现有理论、提炼机制和形成新的科学概念。

论文微分方程发现物理建模 AI for Science 综述 REO框架

推荐理由：这篇综述为做物理建模或AI for Science的研究者提供了一个清晰的领域地图和思考框架，看完能快速理解不同方法适合解决什么问题，建议点开看看。

原文

11:31

arXiv: DeepSeek@Zechen Sun, Yuyang Sun, Zecheng Tang, Juntao Li, Wenpeng Hu, Wenliang Chen, Zhunchen Luo, Guotong Geng, Min Zhang

精选

大型语言模型在生成长文本时面临严重的长度崩溃问题，当目标长度超过 2000 词时性能急剧下降。研究者提出 IS-CoT（交错结构思维链）框架，通过嵌入动态的“计划-写作-反思”循环，实现持续策略调整和全局对齐，无需外部辅助。基于该框架训练的 IS-Writer-8B 模型在 LongBench-Write 等基准上取得最优性能，比 DeepSeek-V3.2 高出 3.08 分，长度合规性和连贯性可与更大规模专有模型竞争。该工作揭示了静态分层规划在长上下文中的局限性，为长文本生成提供了新思路。

论文长文本生成思维链 IS-CoT LLM 写作助手

推荐理由：长文本生成是 LLM 的硬伤，IS-CoT 用动态规划循环解决了长度崩溃，做内容生成或写作助手的团队可以直接参考这个 8B 模型的训练方法。

原文

11:27

arXiv cs.LG@Maja Lindström, Natalija Glisovic, Jan von Pichowski, Tommy Löfstedt, Martin Rosvall

精选

本文提出了一种新的电商营销问题形式化——自动定向（auto-targeting），即联合选择用户和商品以构建多个互不重叠的营销活动。现有方法通常预设活动结构或解耦商品选择与用户分配，无法直接从交互模式中发现活动分组。作者提出了三种互补策略：约束谱双聚类、贪心局部搜索与多臂老虎机框架。在合成数据、Amazon评论基准和商业数据上的实验表明，双聚类方法在活动质量、提升度和公平性上表现最佳，但大规模数据下基于老虎机的方法更具扩展性。

论文电商营销用户-商品分配双聚类多臂老虎机组合优化

推荐理由：电商营销团队终于有了一个能自动发现用户-商品匹配分组的框架，比传统解耦方法更贴合实际业务。做推荐系统或营销策略的工程师可以直接参考其中的双聚类方法，提升活动效果。

原文

11:11

arXiv cs.LG@Berker Demirel, Valentino Maiorca, Marco Fumero, Theofanis Karaletsos, Francesco Locatello

精选

该研究提出了一种后验的、每个样本的信任分数，用于评估条件生成模型在组合偏移下的样本质量。标准评估指标需要参考目标分布，但在外推场景中该分布不可用。新方法结合全局真实性和属性忠实度两个可估计量，仅使用训练分布即可评估样本。实验表明，该方法能有效过滤、排序和弃权生成样本，在生物成像和视觉基准测试中提升了下游性能。代码已开源。

论文条件生成组合偏移样本质量评估信任分数生物成像

推荐理由：做条件生成或科学模拟的团队终于有了一个靠谱的评估工具——不用依赖未知的目标分布，直接用训练数据就能判断生成样本质量，建议做生物成像或可控生成的开发者试试。

原文

11:09

arXiv cs.LG@Yuling Shi, Caiqi Zhang, Yuexian Li, Haopeng Wang, Yeheng Chen, Nigel Collier, Xiaodong Gu

精选

大型语言模型越来越多地用于代码生成，但静默错误程序带来安全风险。现有不确定性估计方法多继承自自然语言，忽略了代码的三个独特特性：单个错误标记可破坏整个程序（标记脆弱性）、算法意图与具体实现可能不一致（意图-代码差距）、以及程序可执行。研究者提出三个正交不确定性轴：词汇（Top-K token熵）、算法（伪代码一致性）和功能（行为一致性）。在五个代码LLM上，三轴集成将平均AUROC从0.696提升至0.776（+8.1点），且单次Top-K token熵在Qwen3-14B上匹配最强多基线，成本降低3倍以上。这表明代码不确定性估计需要代码特定的设计。

论文代码生成不确定性估计 LLM 安全/可靠性 Qwen3-14B

推荐理由：代码生成的不确定性评估长期被自然语言方法误导，这篇论文给出了三个正交维度，做代码LLM安全评估或部署的团队值得仔细看，能直接改进选择性预测和人工审查流程。

原文

11:08

arXiv cs.LG@Gilad Gressel, Rahul Pankajakshan, Julia Diament, Efim Hudis, Krishnashree Achuthan, Yisroel Mirsky

精选

随着LLM被部署为智能体，可靠监控需要知道不仅输出内容，还有哪些指令在引导其行为。当模型推断意外子目标、遵循上下文线索或受提示注入和隐藏目标影响时，这变得困难。现有激活到语言方法无法恢复智能体场景中同时活跃的完整指令集、约束、禁止和子目标。PRISM是一个激活条件解释器，从冻结目标模型的隐藏状态解码出忠实的活动指令要点列表。它使用法官引导的GRPO训练，奖励覆盖的指令并惩罚无支持的指令，在良性、约束、提示注入和隐藏目标设置中优于基线方法，尤其在安全相关目标上表现突出。

论文指令恢复激活解释智能体监控安全 LLM

推荐理由：PRISM解决了LLM智能体监控中指令恢复的盲区，对安全团队和AI治理开发者来说，这是直接可用的工具，建议关注其在实际部署中的效果。

原文

11:07

arXiv cs.LG@Shixiong Jiang, Taozheng Zhu, Fanxin Kong

精选

离线安全强化学习（Safe RL）依赖静态数据集，容易遭受数据毒化攻击——攻击者注入恶意样本导致策略不安全。本文提出Safe-RULE（安全强化反学习）框架，无需从头重新训练或访问原始训练环境，即可移除毒化数据的影响。该方法在反学习过程中同时考虑任务性能和安全约束，实验表明能有效提升对数据毒化攻击的安全性。

论文安全强化学习数据毒化防御反学习离线RL Safe-RULE

推荐理由：做安全强化学习或机器人系统的团队，终于有了一个不用重训模型就能清理毒化数据的方案，值得关注。

原文

11:06

arXiv cs.LG@Mikele Milia, Louis Fabrice Tshimanga, Henning Mueller, Manfredo Atzori, Barbara Di Camillo

精选

研究人员提出scTransformer，这是首个将已知基因调控关系作为先验知识融入Transformer注意力机制的方法。通过约束信息流遵循已知调控结构，模型学习到的细胞表示更具生物学意义。在疾病相关的单核RNA-seq数据集上，scTransformer在细胞类型分类任务中提升了准确率，增强了嵌入空间中细胞类型的分离度，并产生了与已知调控程序一致的注意力模式。该方法在不牺牲性能的前提下增强了模型可解释性，为构建生物学基础的单细胞组学基础模型迈出了原则性的一步。

论文 scTransformer 单细胞转录组基因调控网络注意力机制可解释性

推荐理由：做单细胞转录组分析的团队终于有了一个能同时提升性能和可解释性的Transformer方案——scTransformer把基因调控先验直接嵌入注意力机制，比黑盒模型更可信，建议做生物信息学基础模型的研究者点开看看。

原文

11:04

arXiv cs.LG@Apratim Bhattacharyya, Shweta Mahajan, Sanjay Haresh, Rajeev Yasarla, Reza Pourreza, Litian Liu, Risheek Garrepalli, Roland Memisevic

精选

研究人员提出了 Ego-MC-Bench 基准测试，用于评估视频大语言模型在实时任务指导中主动干预纠错的能力。该基准聚焦于烹饪场景，要求模型在用户犯错时及时介入。实验表明，当前最先进的视频 LLM 在此任务上表现不佳，主要原因是缺乏包含错误和适时干预的训练数据。为此，团队还创建了 Ego-CoMist 合成数据集，通过将非交互式烹饪视频转化为带干预的监督示例。微调该数据集后，小型高效视频 LLM 的性能显著提升，适合部署在边缘设备上提供实时辅助。

论文视频大模型实时干预烹饪场景基准测试合成数据

推荐理由：这项研究直击视频 AI 助手的核心痛点——实时纠错能力，做智能烹饪指导或边缘 AI 应用的开发者值得关注，Ego-CoMist 数据集可以直接用于微调模型。

原文

11:03

arXiv cs.AI@Ang Li, Sean McLeish, Haozhe Chen, Nimit Kalra, Zaiqian Chen, Artem Gazizov, Venkata Anoop Suhas Kumar Morisetty, Bhavya Kailkhura, Harshitha Menon, Zhuang Liu, Brian R. Bartoldson, Tom Goldstein, Sanae Lotfi, Micah Goldblum, Pavel Izmailov

精选

长上下文语言模型推理受限于内存，KV缓存随上下文长度增长。现有压缩方法要么降低模型质量，要么需要大量计算。本文提出Latent Context Language Models (LCLMs)，一种编码器-解码器压缩器，通过架构搜索和预训练350B+ tokens，实现1:4、1:8、1:16压缩比。LCLMs在通用任务性能、压缩速度和峰值内存使用上均优于现有方法，并可作为长时智能体的高效骨干，支持自适应扩展相关片段。

论文上下文压缩 KV缓存长上下文推理编码器-解码器 LCLM

推荐理由：长上下文推理的内存瓶颈终于有了一个兼顾质量与速度的解法，做LLM推理优化或长时智能体的开发者值得关注，LCLM的压缩方案可以直接用于生产环境。

原文

11:02