全部 AI 动态 · AI 热点

5月22日

11:46

arXiv: Google DeepMind@Mohammadreza Narimani, Alireza Pourreza, Parastoo Farajpoor

精选

加州大学团队利用Google DeepMind的AlphaEarth地理空间嵌入，结合U-Net深度学习模型，实现了加州加工番茄田的像素级精准识别。研究基于LandIQ 2018年作物多边形构建了平衡参考数据集，在独立测试集上达到99.19%像素精度和99.04% F1分数。该方法无需手工特征工程，且通过蒙特卡洛dropout提供了不确定性估计，边缘区域不确定性最高。结果表明AlphaEarth嵌入可作为分析就绪的替代方案，支持跨年稳健的作物制图。

论文 AlphaEarth 深度学习作物制图遥感 U-Net

推荐理由：农业遥感团队终于有了无需手工特征工程的端到端方案——AlphaEarth嵌入+U-Net直接输出高精度作物图，做供应链预测和政策分析的可以直接复现。

原文

11:44

arXiv: Anthropic@Lukas Weidener, Marko Brkić, Mihailo Jovanović, Emre Ulgac, Aakaash Meduri

精选72°

RefusalBench是一个新的基准测试，包含141个提示（47组），通过保持任务框架不变、仅改变生物风险等级（良性、边缘、双重用途），来评估前沿大语言模型在合法生物研究提示上的拒绝行为。在2026年5月的19个前沿模型快照中，严格拒绝率从0.1%到94.6%不等，且拒绝率不能准确反映安全校准水平。例如，Grok 4.20在风险区分度上表现最佳（Youden's J = 0.787），但整体拒绝率仅排第七；Claude Opus 4.7的区分度较之前版本下降65%。该研究还发现，18个模型中有9个在双重用途提示上表现出“回避但帮助”的部分合规模式，而二元拒绝指标无法检测到这一点。

论文安全评估基准测试生物研究拒绝行为前沿模型

推荐理由：做AI安全评估或生物研究合规的团队，这个基准能帮你避开“拒绝率越高越安全”的误区——Grok 4.20的案例值得点开看看。

原文

11:41

arXiv: OpenAI@Alexander Smirnov

精选

论文 AI文本检测预训练模型典型性假说 RoBERTa 检测器评估

推荐理由：这项研究戳破了AI文本检测的底层假设——检测器可能只是在放大预训练模型的偏见而非真正学习区分。做AI安全、内容审核或学术诚信检测的团队，看完会重新评估现有检测方案的有效性。

原文

11:40

arXiv: OpenAI@Simon Dennis, Rivaan Patil, Kevin Shabahang, Hao Guo

精选76°

当前智能体编排框架（如LangGraph、CrewAI等）已超过29万GitHub星标，但都依赖外部编排器，每次交互都需注入指令和路由决策，消耗上下文窗口且依赖前沿模型。最新研究提出将工作流直接编译进小模型权重，创建“地下智能体”，在旅行预订、Zoom支持、保险理赔三个任务上，以不到前沿模型1%的成本达到接近前沿模型的质量。该方法解决了程序化任务中编排架构的三大痛点：上下文窗口消耗、必须使用前沿模型、专有流程暴露给第三方。研究团队通过实证表明，小模型微调后能完全内化复杂工作流，无需外部编排。

论文智能体工作流编译模型微调编排框架成本优化

推荐理由：做智能体编排的团队终于有了低成本替代方案——把工作流写进模型权重而非上下文，成本降两个数量级，质量不掉。做客服、保险、旅行预订自动化的开发者可以直接看论文里的14节点和55节点案例。

原文

11:39

arXiv: OpenAI@Sid-ali Temkit

精选72°

研究发现，LLM在连续对话中会受先前评价的极性（正面或负面）影响，对相同测试项做出偏向该极性的判断。实验涉及11个模型、75,898次API调用，发现模型在不确定时偏差更大（高熵项d=-0.34），负面历史影响是正面的1.62倍。偏差不随上下文长度增加，但模型规模增大可减轻（如Haiku -0.22 vs Opus -0.17）。最简单的修复是每个项目使用新上下文，或平衡历史极性。

论文 LLM评估对话偏差上下文影响自动化裁判研究

推荐理由：做AI评估、内容审核或自动化打分的团队，这条研究直接告诉你为什么你的LLM裁判可能不靠谱——负面历史会让它更苛刻，建议每个测试项都开新对话。

原文

11:38

arXiv: OpenAI@Andrii Kryshtal

精选72°

一项新研究测试了 OpenAI、Anthropic、DeepSeek、xAI 的九款模型在 90 个多轮冲突场景中的表现，发现模型在涉及战争罪行、种族灭绝否认、种族歧视等敏感话题时，输出可能加剧社会分裂。失败率从 6% 到 47% 不等，当用户要求“平衡”报道时，五款模型在 80%-100% 的情况下失败。研究首次提出针对冲突场景的评估框架，呼吁将此类测试纳入模型安全评估体系。

论文 AI安全冲突场景模型评估 OpenAI Anthropic DeepSeek xAI

推荐理由：做 AI 安全评估或部署在敏感地区的团队，这篇论文给出了第一个可复用的冲突场景测试框架，能直接用来检查模型是否会在关键议题上“和稀泥”——看完你会重新审视“中立”输出的代价。

原文

11:36

arXiv cs.LG@William Smits

精选

传统决策树使用硬二值阈值划分特征空间，导致远离决策边界与恰好在边界上的样本被赋予相同置信度。本文提出三元决策树，在每个分裂节点上引入以最优阈值为中心的半宽 delta 的不确定区域，落入该区域的样本通过加权混合两个子树的预测结果，并被标记为边界不确定，提示下游应用可区别对待。delta 基于标准 CART 分裂过程中已有的统计量局部计算，无需额外噪声参数。在 72 个 OpenML-CC18 数据集上的 5 折交叉验证中，所有五种 delta 估计方法（质量平台、类重叠、增益比、节点自助法、间隔法）结合概率路由均在决定准确率上显著优于标准 CART（Wilcoxon 符号秩检验，p < 0.001），其中间隔法效率最高（每单位边界不确定标记率带来 0.104 准确率增益），在 42 个数据集上胜出，且无需额外超参数。在医学和金融数据集上，节点自助法在乳腺 X 光检查中通过标记 10.8% 的筛查病例为边界不确定，实现了 +0.71% 的决定准确率提升。

论文决策树不确定性建模分类算法 CART 局部自适应

推荐理由：做分类模型的团队终于有了一个不增加额外参数就能处理边界不确定性的方法——三元决策树在 72 个数据集上显著优于 CART，做医疗或金融风控的开发者可以直接在现有 CART 框架上实现，值得一试。

原文

11:35

arXiv cs.LG@Javad Parsa, Enis Simsar, Amir Joudaki, Thomas Hofmann, André M. H. Teixeira

精选

SeqLoRA 是一种针对文本到图像扩散模型的高效微调方法，解决了多概念组合生成中的表示干扰问题。现有模块化方法要么依赖昂贵的后处理融合，要么冻结适配子空间，限制了表达力和概念保真度。SeqLoRA 通过双层优化联合优化两个 LoRA 因子，并建立强收敛保证，从理论上证明学习 LoRA 基比固定基方法更有效减少干扰。实验显示，SeqLoRA 在多达 101 个概念上提升了身份保持和可扩展性，无需昂贵融合，减少了属性干扰。

论文 LoRA 多概念生成扩散模型持续学习双层优化

推荐理由：做多概念图像生成的团队终于有了一个兼顾保真度和可扩展性的方案——SeqLoRA 用双层优化解决了 LoRA 的干扰问题，支持上百个概念组合，做个性化扩散模型的开发者值得一试。

原文

11:34

arXiv cs.LG@Berk Hayta, Hannah Laus, Simon Mittermaier, Felix Krahmer

精选

证据深度学习（EDL）通过狄利克雷分布实现单次前向传播的不确定性估计，但其损失函数复杂，难以分析和实现。本文提出一种插件损失（plug-in loss），在狄利克雷均值处评估标准损失（如交叉熵），并证明在温和假设下近似误差随证据增长而衰减。该框架将标准 Softmax 分类器纳入不确定性估计，简化了实现。在 Google Speech Commands 数据集上，该方法在预测准确率和选择性预测性能上与经典 EDL 相当，且更易集成到现有训练流程。这是首次在语音识别任务中通过 EDL 获得覆盖-准确率权衡的实证分析。

论文不确定性估计证据深度学习 Softmax 语音识别简化框架

推荐理由：做不确定性估计的团队终于有了更简单的实现路径——用标准 Softmax 损失就能获得 EDL 效果，语音识别研究者可以直接替换现有训练流程试试。

原文

11:31

arXiv cs.LG@Christian Janos Lebeda, David Erb, Tudor Cebere, Aurélien Bellet

精选

Lumberjack 是一种新的差分隐私随机森林算法，通过构建大型随机决策树并应用激进的隐私保护剪枝，显著提升了模型效用。其核心创新是一种针对层次数据的重击检测算法，误差随树高对数增长，支持使用更深的树。在基准数据集上的实验表明，Lumberjack 在隐私预算实用时大幅优于现有方法，建立了新的最优水平。这项工作表明精心设计的差分隐私随机森林可以缩小效用差距，为隐私保护机器学习提供了有前景的新方向。

论文差分隐私随机森林重击检测隐私保护机器学习 Lumberjack

推荐理由：处理敏感表格数据的团队终于有了实用的差分隐私方案——Lumberjack 在隐私预算下显著提升随机森林效用，做隐私保护机器学习的开发者可以直接参考其方法。

原文

11:30

arXiv cs.LG@Samson Gourevitch, Yazid Janati, Dario Shariatian, Umut Simsekli, Eric Moulines, Eric P. Xing, Alain Durmus

精选

本文重新审视了均匀扩散模型（UDM）的训练与推理。研究发现，UDM 的标准参数化并未优化去噪后验，而是优化了一种留一法后验，即预测每个干净 token 时不使用其自身的噪声观测。作者推导了去噪器、留一法后验与分数之间的精确转换，从而分离了参数化与训练目标。基于留一法预测器，他们提出了无需额外训练即可改进推理的预测-校正采样器和温度采样方法。此外，还引入了一种吸收态重构，将 UDM 分解为类似掩码扩散的采样操作，简化了去噪后验。实验表明，留一法参数化持续提升 UDM 生成质量，吸收态构造则匹配或超越掩码扩散，暗示掩码与均匀扩散之间的经验差距更多源于参数化和采样设计，而非边际分布本身。

论文扩散模型 Uniform Diffusion 留一法去噪参数化改进吸收态重构

推荐理由：这篇论文揭示了均匀扩散模型长期被忽视的参数化问题，做离散扩散模型研究的开发者可以直接用留一法改进推理，无需重新训练。看完会对掩码 vs 均匀扩散的差距有全新理解。

原文

11:26

arXiv cs.LG@Huanchi Wang, Zihang Huang, Yifang Tian, Kristina Dzeparoska, Hans-Arno Jacobsen, Alberto Leon-Garcia

精选

FAME 提出了一种标签高效的混合专家框架，用于消息级日志异常检测。传统方法在会话或窗口级别检测异常，粒度粗糙，迫使运维人员检查大量常规日志行。FAME 通过离线使用一次大语言模型，为每个模板标注最多 K 行，生成正常/异常指示符和代表性示例，并自动将模板划分为故障域。训练后的轻量路由器和领域专家可在本地运行，输出异常预测和故障域标签。在 BGL 数据集上，FAME 在 K=100 时达到 F1=98.16，标注量减少 76 倍，并检测出 86.3% 的未见 EventID 异常；在 Thunderbird 上达到 F1=99.95 且召回率完美。

论文日志异常检测混合专家模型 LLM 标签高效故障域

推荐理由：运维团队终于有了兼顾精度和效率的日志异常检测方案——FAME 用一次 LLM 离线标注就解决了消息级检测的痛点，标注量减少 76 倍还能发现未知故障，做日志分析或运维自动化的开发者值得关注。

原文

11:21

arXiv cs.LG@Lily Goli, Justin Kerr, Daniele Reda, Alec Jacobson, Andrea Tagliasacchi, Angjoo Kanazawa

精选

该研究提出了一种名为 Recuriosity 的强化学习方法，解决好奇心驱动探索在3D环境中容易陷入局部循环的问题。核心创新在于使用在线3D重建作为持久的世界模型，并让智能体通过序列模型维护情景轨迹历史，从而避免重复访问已遗忘状态。仅基于好奇心训练，智能体在 HM3D 数据集上超越了基于强化学习的主动建图基线，并零样本泛化到 Gibson 和 AI 生成的世界。该方法还能高效适配下游任务，如摘苹果和图像目标导航，优于从头训练的基线。

论文好奇心驱动 3D探索强化学习持久世界模型情景记忆

推荐理由：做3D视觉和机器人探索的团队终于有了一个能跳出局部循环的解决方案——持久世界模型加情景记忆的组合直接解决了好奇心驱动的核心痛点，值得在复杂环境中一试。

原文

11:19

arXiv cs.LG@Carlos Heredia, Daniel Roncel

精选

研究人员提出了一种名为ICDN（可积分上下文依赖需求网络）的神经网络模型，用于多产品零售需求预测。该模型将对数需求作为对数价格的平滑、上下文条件函数进行学习，从而能够精确推导出弹性。在Dominick's啤酒数据集上，ICDN相比传统的对数-对数基准模型，在样本外泛化上表现更优，并生成了更稳定、经济上更合理的弹性估计，尤其对于弱识别的交叉价格效应。

论文需求预测定价优化神经网络弹性估计零售

推荐理由：零售定价和需求预测的从业者终于有了一个能稳定估计交叉价格弹性的工具——ICDN直接解决了传统模型在弱识别场景下的不稳定问题，做品类管理和定价优化的团队值得关注。

原文

11:18

arXiv cs.LG@Jan Tempus, Philip Whittington, Craig W. Schmidt, Dennis Komm, Tiago Pimentel

精选

当前主流分词算法（如BPE、Unigram）本质上是贪心算法，只做局部最优决策，无法保证整体词汇表质量。研究者将分词器构建形式化为线性规划问题，利用凸优化工具求解，提出新算法ConvexTok。实验表明，ConvexTok在内在分词指标和语言模型的bits-per-byte（BpB）上持续优于现有方法，下游任务性能也有提升但不够稳定。更重要的是，ConvexTok能给出一个下界，证明其分词器在常见词汇表大小下距离最优解不超过1%。

论文分词凸优化 NLP 线性规划 ConvexTok

推荐理由：分词是NLP的基础环节，贪心算法长期占据主流——ConvexTok用凸优化给出了可证明接近最优的方案，做分词器优化或语言模型预训练的团队值得关注。

原文

11:17

arXiv cs.AI@Edwin Jose

精选

HarnessAPI 是一个 Python 框架，旨在解决 LLM 工具部署中 HTTP 端点与 MCP 工具注册重复维护的问题。它通过将类型化的技能文件夹作为单一事实来源，从 handler.py 和 Pydantic 模式自动生成流式 HTTP 端点、交互式 OpenAPI/Swagger UI 和零配置 MCP 工具。该框架支持双模式内容协商，无需修改处理器即可同时服务 SSE 流和 JSON 返回客户端。动态代码生成机制确保 Pydantic 类型注解正确传播到 FastMCP 的检查层，解决了基于闭包注册的技术限制。在六个代表性技能上测试，HarnessAPI 相比手动维护的双栈实现减少了 74% 的框架相关样板代码。

AI产品 MCP/工具开源/仓库 Python框架流式API LLM工具部署

推荐理由：做 LLM 工具部署的开发者终于可以告别 HTTP 和 MCP 两套代码的重复维护了——HarnessAPI 用一个技能文件夹自动生成所有接口，减少 74% 样板代码，值得直接试试。

原文

11:16

arXiv cs.AI@Youssef Allouah, Mahdi Haghifam, Sanmi Koyejo, Reza Shokri

精选

本文通过最小最大博弈框架研究模型蒸馏攻击中的部署权衡：模型输出越有用，越容易被模仿。作者提出自适应评估规则，学生可重加权高价值样本；同时设计教师端防御模板，抑制最易被蒸馏的输出。基于示例价值的廉价代理，提出Product-of-Experts (PoE) 防御，仅需前向传播即可结合教师与代理学生。实验表明，自适应评估揭示被动与自适应攻击的巨大差距：在GSM8K和MATH上，自适应学生恢复的能力远超被动评估。PoE在成本远低于现有防御的情况下，鲁棒性差距显著缩小，且保留更高质量的推理轨迹。代码已开源。

论文蒸馏攻击模型安全自适应攻击防御机制博弈论

推荐理由：这篇论文戳破了蒸馏防御的假象——被动评估下的鲁棒性在自适应攻击面前不堪一击。做模型安全或部署的团队，建议用文中的自适应评估框架重新审视你的防御方案。

原文

11:15

arXiv cs.AI@Santo M. A. R. Thies, Hubert Baniecki, R. Teal Witter, Eyke Hüllermeier, Maximilian Muschalik, Fabian Fumagalli

精选

ProxySHAP 是一种新的交互指数估计方法，解决了现有方法在速度和精度之间的权衡问题。它结合了树代理模型的高样本效率和残差校正的一致性路径，理论上推导了树集成交互指数的多项式时间算法，避免了指数级复杂度。实验表明，ProxySHAP 在近似质量上达到新 SOTA，在数千特征的大规模应用中误差最低，显著优于 ProxySPEX 和 KernelSHAP-IQ。该方法为机器学习中的高阶交互分析提供了实用且准确的工具。

论文可解释性 Shapley值交互指数代理模型树集成

推荐理由：做模型可解释性研究的团队终于有了兼顾速度和精度的交互指数估计器——ProxySHAP 在数千特征场景下仍保持低误差，值得直接替换现有方法。

原文

11:14

arXiv cs.AI@Ismail Geles, Leonard Bauersfeld, Markus Wulfmeier, Davide Scaramuzza

76°

苏黎世大学团队通过多智能体强化学习（MARL）训练高速四旋翼无人机竞速，在超过22米/秒的速度下，不仅击败了人类冠军飞行员，还将碰撞率比最先进的单智能体基线降低了50%。该研究以联赛式自对弈训练智能体学会主动避让、超车和处理复杂气动干扰，并实现了对人类的零样本安全泛化。结果表明，多智能体交互的严苛训练比孤立的安全约束更能实现鲁棒的机器人共存。

论文多智能体强化学习无人机竞速安全交互零样本泛化苏黎世大学

推荐理由：这项研究证明了多智能体强化学习在物理世界交互中的安全优势，做无人机、自动驾驶或机器人协作的团队值得关注——它用竞速场景给出了一个可复现的范式。

原文

11:12

arXiv cs.AI@Girish Narayanswamy, Maxwell A. Xu, A. Ali Heydari, Samy Abdel-Ghaffar, Marius Guerard, Kara Vaillancourt, Zhihan Zhang, Jake Garrison, Levi Albuquerque, Dimitris Spathis, Hong Yu, Hamid Palangi, Xuhai "Orson" Xu, David G. T. Barrett, Joseph Breda, Jed McGiffin, Yubin Kim, Yuwei Zhang, Naghmeh Rezaei, Samuel Solomon, Karan Ahuja, Tim Althoff, Jake Sunshine, Ming-Zher Poh, Benjamin Yetton, Ari Winbush, Nicholas B. Allen, James M. Rehg, Isaac Galatzer-Levy, Yun Liu, John Hernandez, Anupam Pathak, Conor Heneghan, Yuzhe Yang, Ahmed A. Metwally, Pushmeet Kohli, Mark Malhotra, Shwetak Patel, Xin Liu, Daniel McDuff

精选72°

研究人员提出了一种面向可穿戴健康数据的基础模型，该模型在来自500万参与者的超过1万亿分钟未标记传感器信号上进行了预训练。通过联合扩展模型容量和预训练数据量，该模型在35项健康预测任务上（涵盖心血管、代谢、睡眠、心理健康及生活方式等）表现出系统性性能提升。该模型支持少样本学习和生成能力，可稳健估计日常健康指标。研究还部署了一组LLM智能体来自动搜索基于模型嵌入的下游预测头，并展示了性能随LLM能力提升而增强。最后，将下游预测器集成到个人健康代理中，经1860次临床医生评分验证，模型响应更相关、更具上下文意识且更安全。

论文基础模型可穿戴健康少样本学习 LLM智能体个人健康代理

推荐理由：这项研究解决了可穿戴数据标注稀缺和个体差异大的核心难题，做健康AI或可穿戴设备开发的团队可以直接参考其预训练方法和少样本学习策略，值得关注。

原文

11:11

arXiv cs.AI@George Tsoukalas, Anton Kovsharov, Sergey Shirobokov, Anja Surina, Moritz Firsching, Gergely Bérczi, Francisco J. R. Ruiz, Arun Suggala, Adam Zsolt Wagner, Eric Wieser, Lei Yu, Aja Huang, Miklós Z. Horváth, Andrew Ferrauiolo, Henryk Michalewski, Codrut Grosu, Thomas Hubert, Matej Balog, Pushmeet Kohli, Swarat Chaudhuri

精选72°

研究人员首次大规模评估了用大语言模型生成形式化证明（Lean 语言）解决开放数学问题的能力。其最强大的智能体以每个问题几百美元的成本，自主解决了 353 个开放 Erdős 问题中的 9 个，并证明了 492 个 OEIS 猜想中的 44 个。该智能体已被部署在组合数学、优化、图论、代数几何和量子光学研究中。一个更基础的智能体（交替 LLM 生成与 Lean 验证）也复现了 Erdős 问题的成功，但在最难问题上成本更高。这些结果展示了 AI 辅助形式化证明搜索的潜力，并揭示了实现这一能力的智能体设计。

论文形式化证明 Lean 大语言模型数学推理 Erdős 问题

推荐理由：数学研究者终于有了能真正解决开放问题的 AI 工具——成本可控且覆盖多个数学分支，做组合数学或图论的人可以直接用这个智能体尝试自己的猜想。

原文

11:10

arXiv cs.AI@Pilchen Hippolyte, Fabre Romain, Signe Talla Franck, Perez Patrick, Grave Edouard

精选72°

该研究探讨了预训练数据顺序对大语言模型获取时间敏感事实知识的影响。作者构建了包含7000多个时间锚定问题的基准测试，并训练了6B参数模型，比较了按时间顺序预训练与标准随机打乱预训练的效果。结果显示，按时间顺序训练的模型在通用语言理解和常识方面与随机基线相当，但事实知识更新、更精确。随机预训练模型在旧数据上表现更好，可能是因为事实重复更多。研究为LLM持续学习提供了基础，并开源了代码、检查点和数据集。

论文大语言模型预训练数据时序性事实知识持续学习

推荐理由：这项研究揭示了数据顺序对模型知识时效性的关键影响，做LLM预训练或持续学习的团队值得关注，可以直接参考其基准和训练方法。

原文

11:09

arXiv cs.AI@Long Phan, Devin Kim, Alexander Pan, Alice Blair, Adam Khoja, Dan Hendrycks

精选

研究发现大语言模型在处理对立政治话题时存在不对称性，表现为隐蔽政治偏见，包括7类操纵技术。作者提出两个新指标：情感一致性和帮助一致性，分别衡量修辞框架和交互深度的对称性。为减少这种偏见，他们提出政治一致性训练（PCT），包含情感一致性和帮助一致性两种互补的强化学习范式。实验表明PCT在保持模型整体帮助性的同时，显著降低了隐蔽政治偏见，并能泛化到未见的基准测试。相关代码和数据已开源。

论文大语言模型政治偏见一致性训练强化学习开源/仓库

推荐理由：这项研究戳中了LLM在敏感话题上的隐藏偏见问题，做AI安全、内容审核或政治相关应用的团队值得关注，可以直接用PCT方法减少模型被操纵的风险。

原文

11:08

arXiv cs.AI@Yu Tang, Muhammad Zakwan, Efe Balta, John Lygeros, Alisa Rupenyan

精选

该论文提出了一种基于事件的深度强化学习方法，用于解决柔性作业车间调度问题中随机订单到达的挑战。研究采用近端策略优化算法和轻量级多层感知机训练智能体，以最小化所有作业的总完成时间。智能体从一组成熟的调度规则中选择动作，状态表示直接从环境中获取。仿真结果表明，该方法在不同异质性和订单到达率的数据集上均优于任何单一调度规则，并且在数据集异质性高时表现尤为出色。

论文深度强化学习柔性作业车间调度随机订单到达近端策略优化调度规则

推荐理由：制造和物流领域的调度团队终于有了应对随机订单到达的实用方案——DRL 智能体比传统调度规则更灵活，尤其适合订单类型多样的场景，做生产排程优化的可以直接参考实验方法。

原文

11:07

arXiv cs.AI@Amir Mousavi, Mohammad Sadegh Sirjani, Erfan Nourbakhsh, Mimi Xie, Rocky Slavin, Leslie Neely, John Davis, John Quarles

精选

实时认知负荷评估对自适应人机交互至关重要，但受限于标注数据少和跨个体泛化差。CogAdapt提出LeadBridge适配器，将3导联可穿戴信号转换为12导联临床格式，并结合ProFine渐进微调策略，防止灾难性遗忘。在CLARE和CL-Drive数据集上，CogAdapt的宏F1分数分别达0.626和0.768，显著优于从头训练的基线模型。该工作证明了基础模型迁移在可穿戴设备上实现个体无关认知负荷评估的可行性。

论文 ECG基础模型认知负荷评估可穿戴设备迁移学习 CogAdapt

推荐理由：做可穿戴设备或脑机接口的团队，终于有了一个把临床大模型直接用到低导联设备上的实用方案——CogAdapt的LeadBridge适配器解决了传感器不匹配的痛点，建议做认知负荷评估的开发者直接参考。

原文

11:06

arXiv cs.AI@Amir Mousavi, Mohammad Sadegh Sirjani, Erfan Nourbakhsh, Mimi Xie, Rocky Slavin, Leslie Neely, John Davis, John Quarles

精选

眼动追踪数据在实时认知负荷评估中面临两大挑战：眨眼和追踪失败导致的数据频繁缺失，以及长时程依赖的高效建模。MambaGaze框架通过显式缺失数据建模（XMD编码）和双向Mamba-2结构解决这些问题，在CLARE和CL-Drive数据集上分别达到76.8%和73.1%的准确率，超越CNN、Transformer等基线4-12个百分点。在NVIDIA Jetson边缘设备上实现43-68 FPS的实时推理，功耗低于7.5W，适合可穿戴认知负荷监测场景。该工作为安全关键应用（如驾驶员警觉监控、自动化驾驶舱辅助）提供了可行的AI方案。

论文认知负荷评估眼动追踪 Mamba 缺失数据建模边缘部署

推荐理由：眼动数据缺失是认知负荷评估的长期痛点，MambaGaze用双向Mamba显式建模缺失模式，做可穿戴AI或人机交互的团队可以直接参考其边缘部署方案。

原文

11:05

arXiv cs.AI@Stanislav R. Kirpichenko, Andrei V. Konstantinov, Lev V. Utkin

精选

生存分析旨在从含删失数据中估计事件时间分布，但现有方法常对风险函数施加结构假设或离散化时间轴，限制了灵活性并引入近似误差。本文提出生存扩散概率模型（SDPM），一种基于去噪扩散模型的连续时间生存分析方法。SDPM 直接建模生存结果的条件分布，利用条件独立删失假设，通过生成样本结合 Kaplan-Meier 估计器得到生存函数，无需参数假设或时间离散化。在十个真实数据集上，SDPM 在 C-index、时间依赖 AUC 和 Brier 评分上达到与树模型、提升模型和神经网络模型相当的预测性能。合成数据实验表明，SDPM 能更准确地恢复底层连续生存分布的形状，消融研究验证了目标空间变换对事件率校准和预测区分度的提升。

论文生存分析扩散模型连续时间生成模型 SDPM

推荐理由：生存分析是医学、可靠性工程等领域的核心问题，SDPM 用扩散模型绕过了传统方法的参数假设和离散化限制，做生存预测的团队可以直接用公开代码复现，值得关注。

原文

11:04

arXiv cs.AI@Yunpeng Dong, Jingkai He, Yuze Hou, Dong Du, Zhonghu Xu, Si Yu, Yubin Xia, Haibo Chen

精选72°

DeltaBox 提出了一种新的操作系统级抽象 DeltaState，用于实现 AI 智能体沙箱的毫秒级检查点与回滚。其核心洞察是：智能体运行中连续检查点高度相似，因此只需复制变化部分而非整个状态。DeltaBox 包含两个协同设计的机制：DeltaFS 通过分层文件系统实现基于变化的文件状态 C/R，DeltaCR 通过增量转储和模板进程 fork 加速进程状态回滚。实验表明，DeltaBox 的检查点和回滚延迟分别仅为 14ms 和 5ms，相比传统全量复制方法大幅降低，使得智能体在固定时间预算内能探索更多节点。该工作对需要高频状态探索的 AI 智能体（如测试时树搜索、强化学习）有重要价值。

论文智能体沙箱检查点/回滚操作系统 DeltaBox

推荐理由：做 AI 智能体高频状态探索（如树搜索、强化学习）的团队，终于有了能跑在毫秒级的沙箱 C/R 方案，不用再被几百毫秒的延迟卡脖子，建议直接看论文实现。

原文

11:03

arXiv cs.AI@Sadia Asif, Mohammad Mohammadi Amiri, Momin Abbas, Prasanna Sattigeri, Karthikeyan Natesan Ramamurthy

精选

基于大语言模型的多智能体系统常通过中间通信协调任务，其中通过Transformer的KV缓存进行潜在通信能提升效率并保留更丰富的任务相关信息。但KV缓存会编码上下文输入、中间推理状态和智能体特定信息，形成不透明通道，可能导致敏感内容在智能体间传播而无需显式文本披露。为此，研究者提出LCGuard框架，将共享KV缓存视为潜在工作记忆，在缓存工件传输前学习表示级变换。通过对抗训练形式化敏感信息泄露：若对抗解码器能从共享缓存中恢复智能体特定敏感输入，则视为不安全。实验表明，LCGuard在多个模型家族和多智能体基准上持续降低基于重建的泄露和攻击成功率，同时保持与标准KV共享基线相当的任务性能。

论文多智能体系统 KV缓存安全/隐私对抗训练 LCGuard

推荐理由：多智能体系统开发者终于有了保护KV缓存中隐式敏感信息的方案——LCGuard在不牺牲任务性能的前提下阻断信息重建攻击，做分布式AI协作的团队值得关注。

原文

11:02

arXiv cs.AI@Ali Hatamizadeh, Yejin Choi, Jan Kautz

精选72°

线性注意力模型通过固定大小的循环状态替代软注意力的无限缓存，但如何高效编辑压缩记忆而不打乱已有关联是难点。现有Delta规则模型使用单一标量门控同时控制擦除旧内容和写入新内容，存在耦合限制。Gated DeltaNet-2提出通道级擦除门控b_t和写入门控w_t，将两者解耦，可退化为KDA和Gated DeltaNet。在1.3B参数、100B FineWeb-Edu tokens训练下，该模型在语言建模、常识推理和检索任务上全面超越Mamba-2、Gated DeltaNet、KDA和Mamba-3。尤其在长上下文RULER基准的多键检索设置中优势显著，代码已开源。

论文线性注意力门控机制长上下文开源/仓库推理模型

推荐理由：线性注意力研究者终于有了更精细的门控机制——Gated DeltaNet-2把擦除和写入分开控制，做高效长序列建模的团队可以直接复现并对比效果。

原文

11:01

arXiv cs.AI@Qianshu Cai, Yonggang Zhang, Xianzhang Jia, Wei Xue, Jun Song, Xinmei Tian, Yike Guo

精选

现有自主智能体系统部署后基本静态，无法从用户交互中学习，重复故障需等待人工更新修复。MOSS 提出源码级自我进化方法，直接修改智能体系统的源代码，而非仅调整文本可变的技能文件或提示配置。系统通过自动收集生产故障证据、多阶段确定性流水线生成代码修改，并在临时工作器中验证候选版本，最后通过用户同意的容器热替换实现部署。在 OpenClaw 基准测试中，MOSS 单次循环将平均评分从 0.25 提升至 0.61，无需人工干预。该方法解决了文本层无法触及的结构性故障（如路由、钩子顺序、状态不变量等），为智能体系统持续自我改进提供了更通用的框架。

论文自主智能体自我进化源码重写故障修复 OpenClaw

推荐理由：做自主智能体系统开发的团队终于有了能自动修复代码级故障的方案——MOSS 让智能体从用户交互中学习并自我改进，建议关注其源码级重写机制如何解决传统文本层无法触及的结构性问题。

原文

10:59

arXiv cs.AI@Vishal Rajput

精选

本文提出“匹配原则”，将鲁棒性、域适应、光度不变性、组合泛化、时间鲁棒性、对齐安全等看似独立的问题统一为同一个统计问题：估计部署干扰的协方差，然后沿着覆盖该协方差的矩阵正则化编码器雅可比矩阵。在线性高斯模型中，作者证明了闭式最优性（定理A），包括匹配范围内的立方根水填充；证明了二次雅可比惩罚需要范围覆盖（定理G）；并提供了七个条件一致性引理。作者引入轨迹偏差指数（TDI），一种无标签的嵌入敏感性探针。在从经典ML到Qwen2.5-7B的13个预注册实验中，12个通过了预测的匹配-各向同性-错误W顺序测试。在7B规模上，匹配风格PMH提高了选择性诚实性，并保持了风格TDI，而标准DPO则使其退化。

论文表示学习鲁棒性域适应正则化匹配原则

推荐理由：这篇论文把鲁棒性、域适应等一堆看似无关的问题统一成了一个统计框架，做表示学习或模型泛化的研究者可以直接用匹配原则指导正则化器设计，省去试错成本。

原文

10:58

arXiv cs.AI@Ryan Bahlous-Boldi, Isha Puri, Idan Shenfeld, Akarsh Kumar, Mehul Damani, Sebastian Risi, Omar Khattab, Zhang-Wei Hong, Pulkit Agrawal

精选72°

当前大语言模型的后训练通常优化单一标量奖励，导致输出分布低熵，难以在推理时搜索（如AlphaEvolve）中展现多样性。本文提出向量策略优化（VPO），一种显式训练模型适应多样化下游奖励函数并产生多样化解决方案的强化学习算法。VPO利用实践中奖励常为向量形式（如代码生成的逐测试用例正确性、多种用户画像或奖励模型），作为GRPO优势估计器的即插即用替代，训练模型输出一组解，每个解专门针对向量奖励空间中的不同权衡。在四个任务上，VPO在测试时搜索（如pass@k和best@k）中匹配或超越最强标量RL基线，且差距随搜索预算增大而扩大。对于进化搜索，VPO模型能解决GRPO模型完全无法解决的问题。

论文强化学习推理时搜索多样性训练 VPO GRPO

推荐理由：VPO解决了LLM在推理时搜索中缺乏多样性的痛点，做强化学习后训练或推理时搜索的团队值得关注，它直接替换GRPO就能提升搜索效果。

原文

10:46

arXiv: DeepSeek@Xiaogeng Liu, Xinyan Wang, Yingzi Ma, Yechao Zhang, Chaowei Xiao

精选

论文研究了在推理任务中，教师模型token的可靠性并非均匀分布，而是与序列中的位置强相关。作者提出分支可行性诊断方法，发现位置得分是预测教师token可靠性的最强指标（AUROC达0.83），而局部不确定性得分效果很差。基于此，提出位置加权在线策略自蒸馏（PW-OPSD），在保持原有训练框架的同时，对越靠后的token赋予更高权重。在Qwen3-4B上，PW-OPSD使AIME 2024和2025的Avg@12分别提升1.0和1.1分，在DeepSeek-R1-Distill-Llama-8B和Olmo-3-7B-Think上也取得一致改进。该方法无需额外教师计算，直接利用轨迹结构提升蒸馏效果。

论文推理模型自蒸馏位置加权教师模型 token可靠性

推荐理由：做推理模型蒸馏的团队终于有了一个简单有效的改进方向——不用改架构，只需调整token权重就能提升1分以上，值得在自家模型上复现。

原文

10:45

arXiv: DeepSeek@Mao Zheng, Zheng Li, Tao Chen, Bo Lv, Mingrui Sun, Mingyang Song, Jinlong Song, Hong Huang, Decheng Wu, Hai Wang, Yifan Song, Yanfeng Chen, Guanwei Zhang, Guanghua Yu, Yi Su, Hong Liu, Jinxiang Ou, Keyao Wang, Weile Chen, Haozhao Kuang, Kai Wang, Nuo Chen, Zihao Zheng, Chenhao Wang, Bin Xing, Chengcheng Xu, Tinghao Yu, Binghong Wu, Long Xu, Jiacheng Shi, Yunhao Wang, Baifang Chen, Lei Zhang, Qi Yang, Zhao Wu, Jiacheng Li, Lan Jiang, Lanrui Wang, Kai Zhang, Shuaipeng Li, Zhongzhi Chen, Weixuan Sun, Jiaqi Zhu, An Wang, Wei Li, Jun Xia, Weidong Han, Wutian Yang, Litong Hui, Luoguo Jia, Jiajia Wu, Xinpeng Zhou, Tianxiang Fei

精选

Hy-MT2 是一系列面向复杂真实场景的快速多语言翻译模型，包含 1.8B、7B 和 30B-A3B（MoE）三个尺寸，支持 33 种语言间的翻译。通过 AngelSlim 1.25-bit 极端量化，1.8B 模型仅需 440MB 存储，推理速度提升 1.5 倍，适合端侧部署。在通用、商业、领域和指令跟随翻译任务中，7B 和 30B 模型在快速思考模式下超越 DeepSeek-V4-Pro 和 Kimi K2.6 等开源模型，1.8B 模型整体也优于微软和豆包等主流商业 API。该工作为多语言翻译提供了高效且强大的新选择。

AI模型多语言翻译 Hy-MT2 端侧部署量化开源模型

推荐理由：做多语言翻译或端侧部署的团队终于有了一个又快又准的选择——1.8B 量化后 440MB 就能跑，性能还超过微软豆包 API，值得直接上手试。

原文

10:44