全部 AI 动态 · AI 热点

6月23日

11:04

arXiv cs.AI@Zhuoran Jin, Kejian Zhu, Hongbang Yuan, Yupu Hao, Pengfei Cao, Yubo Chen, Kang Liu, Jun Zhao

该研究系统评估12项多模态任务，涵盖感知与推理两类，使用14个非推理模型和8个推理模型。结果显示，CoT在视觉定位、目标计数等感知任务中会导致性能下降，但在数学、科学和多图推理中有效。开源多模态推理模型整体提升有限，可能因过度侧重数学。当前多模态CoT存在'轻看，重思'模式，视觉反省持续减弱，而口头反思相对保持。视觉推理仍是主要瓶颈。

论文 CoT 多模态推理推理模型视觉推理多模态任务

推荐理由：这篇论文系统测了多模态思维链到底行不行，发现它在视觉定位上帮倒忙，但对数学推理很管用，还揭示了视觉瓶颈。做多模态的值得看。

原文

11:03

arXiv cs.AI@Yikun Fu, Bowen Fu, Zhenyu Wu, Shuang Cheng, Xiaowei Sun, Bowen Yang, Zehao Li, Yibo Zhao, Zichen Ding, Zhoumianze Liu, Shijie Wang, Biqing Qi, Bowen Zhou

MacAgentBench新基准包含676个任务覆盖25个macOS应用，近60%任务需要同时操作GUI和命令行。采用确定性规则评估并引入细粒度多检查点评分。实验在3个框架和16个模型上进行，最优配置Claude Opus 4.6 on OpenClaw达到73.7% Pass@1，优势主要来自技能库而非框架设计。细粒度指标显示相同Pass@1的模型在子目标完成上差异显著。

论文 MacAgentBench OpenClaw Claude Opus 4.6 桌面自动化智能体评估

推荐理由：这篇论文发布了MacAgentBench，一个包含676个macOS桌面任务的智能体基准。它用细粒度评分发现Claude Opus 4.6配合OpenClaw能拿到73.7%的正确率，而且不同模型表面分一样但实际完成能力差很多，值得研究智能体的去看。

原文

11:03

arXiv cs.AI@Junhao Chen, Chanyu Zhu, Zheqi Lv, Keting Yin, Shengyu Zhang

自回归视觉模型（AVM）基于下一尺度预测进行图像和视频合成，但语义错误易累积。现有免训练方法忽略中间生成状态，导致错误未被诊断。Gazer框架引入多模态大语言模型反馈，在AVM采样循环中通过反思诊断和语义修正两个阶段实时纠正错误。在组合图像和视频基准测试中，Gazer提升了多个AVM的语义对齐和组合准确性，无需额外训练。

论文 Gazer AVMs 多模态大语言模型语义修正免训练

推荐理由：这个框架不用重训模型，就能在图片和视频生成时自动修语义错，比之前的免训练方法更靠谱。

原文

11:01

arXiv cs.AI@Shiyang Chen

73°

论文发现，长程 LLM 智能体依赖的上下文压缩机制会静默移除原本遵守的安全策略，导致违规行为。在 ConstraintRot 基准测试中，1323 个 episode 显示策略完整时违规率 0%，压缩后升至 30%，部分模型达 59%。攻击者还能通过对抗性注入诱导压缩器忽略合法策略。作者提出免训练的 Constraint Pinning 方法，将约束隔离在无损压缩外，恢复违规率至 0%。

论文 LLM agents ConstraintRot Governance Decay AI安全智能体

推荐理由：这篇论文揭示了上下文压缩让 LLM 智能体偷偷遗忘安全规则，还给了可防护方案，做 AI 安全的一定要看。

原文

10:58

arXiv cs.AI@Gregory Gorbov, Artem Latyshev, Aleksandr I. Panov

本研究提出Imagine方法，结合可学习世界模型与高层、低层两种互补策略，解决强化学习中的安全探索问题。高层策略生成中间子目标，引导探索偏向安全区域；低层策略利用世界模型的想象展开减少不安全行为。在长时域高维动作空间的导航和操作任务上，该方法在成功率和约束满足方面显著优于现有安全RL基线，一致满足预设安全预算。

论文分层强化学习安全探索世界模型 Imagine Safe RL

推荐理由：这篇论文提出用世界模型加分层策略搞安全RL，在长期任务上比现有方法成功率和安全性都高不少，值得一看。

原文

10:57

arXiv cs.AI@Liang Ding, Xintong Wang

Agentic AI任务在长链执行时因环境不确定性呈指数级失败，每步确定性δ<1时k步成功率衰减为δ^k。论文提出三个形式化结果：确定性-效率界限、验证者-古德哈特定理下限、环境技能演化的收敛条件。研究者构建了基于五个可测量属性的供应确定性指数（SCI）和五级确定性成熟度模型（DMM）。论文还提出了一个可证伪的开放问题框架OQ1-OQ5。立场与平台无关，并讨论了模拟到现实充分性、对齐充分性和AI作为正常技术三种竞争观点。

论文智能体推理模型多智能体 AI安全确定性环境

推荐理由：这篇论文分析了智能体AI在不确定环境中的失败机制，还给出了SCI和DMM实用框架。如果你做AI智能体开发，这些形式化结论值得参考。

原文

10:55

arXiv cs.AI@Saumya Biswas, Amrit De, Md Tauhidul Islam

论文提出一个由大语言模型（LLM）编排的设计代理，用于硅绝缘体（SOI）2×2定向耦合器。LLM提出候选间隙值并判断收敛，频率域本征模求解器估算耦合系数κ，独立时域有限差分（FDTD）进行验证。两个求解器均基于相同的2D有效折射率模型，设计κ与FDTD响应之间残差对应一个固定额外耦合长度2.837 μm。该代理实现50/50分束器，FDTD测得的交叉分数为0.498（目标0.500），残差0.0017。结果在2D有效折射率模型内自洽，LLM经过多次尝试成功交付设计。

论文 LLM FDTD 定向耦合器智能体光子学设计

推荐理由：这篇论文让LLM指挥本征模和FDTD模拟自动设计定向耦合器，误差仅0.0017，省去手动调参的麻烦。

原文

10:52

arXiv cs.AI@Hongqiao Dong, Wenhao Chi, Ruobing Liang, Xiaokui Yang, Wenhua Liang, Peng Hou, Wenjun Pu, Yipeng Zhao, Ping Chen, Haiping Liu, Jianxing He, Bo Liu

Hi-Seg是一种基于SAM的人机循环分割框架，用于肺结节CT图像分割。研究使用了来自12个中心1179名患者的胸部CT扫描进行外部验证。所有标注者组平均Dice得分接近85%，优于5个最先进的深度学习模型（10-22%）和13个SAM变体（1-29%）。经过短期训练的非医学标注者达到了与初级医学生相当的性能。该工作表明人机循环分割可减少临床医生工作量并实现可扩展的众包标注。

论文 SAM Hi-Seg 肺结节分割人机协作医学影像

推荐理由：这篇论文用SAM加人工迭代的方法做肺结节分割，Dice近85%，比13种SAM变体都强，非医学人员培训后也能干医学标注的活。

原文

10:47

arXiv cs.LG@Rodrigo Herrera, Vianey Leos-Barajas, Gwendolyn Eadie, Elizaveta Semenova, James Davenport

该论文提出一种生成式替代框架，利用变分自编码器（VAE）学习Celerite先验的压缩表示，将高维相关随机依赖映射到低维各向同性流形，从而绕过精确协方差运算，将计算负担转为快速神经网络前馈。在模拟研究中，该VAE替代框架准确再现了Celerite等精确物理核的结构保真度。作者将VAE近似嵌入结合Celerite和隐马尔可夫模型（HMM）的加性模型，用于恒星耀斑检测。在实测天体物理时间序列上，VAE+HMM架构相比精确Celerite+HMM框架显著降低了计算时间，实现了大规模数据档案中的恒星耀斑特征化。

论文 Celerite VAE HMM 恒星耀斑时间序列

推荐理由：这篇论文用VAE加速了Celerite和HMM的恒星耀斑检测，解决了GP计算慢的老问题，实测时间大幅缩短，做天文时间序列分析的值得一看。

原文

10:47

arXiv cs.LG@Yan Xie, Sijie Zhu, Tiansheng Wen, Bo Chen, Yifei Wang

标准在策略蒸馏（OPD）对所有token均匀加权，但研究发现学生rollout越长，后续token与教师分布偏差越大。仅使用前30%的token即可达到全token性能，而仅用后30%几乎学不到东西。基于约束优化视角，提出重要性加权在策略蒸馏（IW-OPD），根据累积偏差动态调整token权重。IW-OPD收敛更快，在AIME-2025基准上性能提升多达6.9分。

论文 OPD IW-OPD AIME-2025 推理模型位置偏差

推荐理由：这篇论文揭示了OPD中后面token质量差的问题，提出IW-OPD加权方案，在AIME-2025上提分6.9，做蒸馏研究的值得一看。

原文

10:46

arXiv cs.LG@Jungyong Son, Jinwook Jung, Sungyong Baik

SiM通过奇异值分解（SVD）为每个任务构建低秩流形，利用测试输入特征在任务流形上的投影残差进行无训练路由。仅需每个任务32个样本的支撑集即可离线预计算流形，合并过程无需额外数据。在计算机视觉和自然语言处理基准上，任务未知推理场景下SiM显著提升合并模型性能，持续缩小与独立专家模型的差距。该方法无需存储完整专家参数，兼容子空间/掩码合并。

论文 SiM 多任务模型合并无训练路由模型合并 SVD

推荐理由：这篇论文提出了SiM方法，不用额外训练就能动态路由多任务模型，只用少量样本预计算，效果逼近独立专家。

原文

10:45

arXiv cs.LG@Yue Wang

本文针对多智能体强化学习（MARL）部署时的模型失配问题，提出无限时域平稳分布鲁棒均值场博弈框架。建立了具有压缩贝尔曼算子的鲁棒动态规划原理，通过不动点论证证明了平稳鲁棒均值场均衡的存在性。进一步给出了首个具有收敛保证的算法。将均值场解与有限人口鲁棒博弈关联，在压缩动力学下得到显式非渐近误差界。数值实验验证了多不确定性模型下的鲁棒性影响。

论文 MARL Mean-Field Games Distributional Robustness 误差界

推荐理由：这篇论文解决了多智能体强化学习中模型失配的难题，用分布鲁棒均值场博弈给出了严格的理论证明和算法，还给了误差界，搞博弈论和鲁棒优化的值得看。

原文

10:44

arXiv cs.LG@Na Sang, Ding Ma, Rui Sang, Yuxuan Liu

提出概念约束提示学习(CCPL)框架，使用共享上下文标记和冻结概念原型，通过文本空间余弦一致性对齐learnable类提示。默认设lambda=0.5、概念dropout p=0.3、弱概念引导融合alpha=0.1。在DTD上基类到新类调和平均数提升0.6，EuroSAT提升2.9，OxfordPets下降0.1。实验表明概念约束在概念原型与数据集语义自然对齐时效果最佳。

论文 CLIP CCPL CoOp 少样本学习提示学习

推荐理由：这篇论文提出了CCPL，用概念原型约束提示学习，在DTD和EuroSAT上比CoOp有稳定提升，值得少样本CLIP调优的读者看看。

原文

10:43

arXiv cs.LG@Ting-Ju Wei, Yen-Ming Lu, Chuin-Shan Chen

该论文提出压电深度材料网络（PDMN），用于高效均质化两相压电复合材料。PDMN将机电均质化关系嵌入网络架构，形成半解析代理模型。在聚偏氟乙烯（PVDF）和铌酸锂（LiNbO₃）两相复合材料上验证，非线性电弹性及粘弹性-压电耦合加载下均有效。计算成本相比直接数值模拟（DNS）降低超过三个数量级，同时保持高精度。

论文压电复合材料多尺度均质化 Deep Material Network PVDF

推荐理由：这篇论文用PDMN网络把压电复合材料的模拟速度提升了上千倍，适合做多尺度设计的你参考。

原文

10:43

arXiv cs.LG@Milton Mondal, Sushovan Chanda, Mohamad Mahdi Alawieh, Brijesh Sukhadiya, Donatus Krah, Clinton Gonsalves, Antonios Ntolkeras, Silvio O. Rizzoli, Ali H. Shaib

标准Pauli测量下量子神经网络输出被约束在[-1,1]区间，导致交叉熵损失对logit差异敏感度不足，梯度被抑制。本文首次将这一效应定义为测量诱导logit收缩。提出可学习的量子测量温度（QMT）参数，在损失函数之前重新缩放量子测量输出，补偿物理测量范围限制。QMT不改变量子电路结构或测量算子。在荧光显微图像与六类Fashion MNIST实验中，QMT一致提升了logit分离度、梯度强度和训练稳定性，并提高了分类准确率。

论文 Hybrid QNNs QMT Fashion MNIST 量子机器学习训练稳定性

推荐理由：这篇论文找到了混合量子神经网络训练不稳定的一个隐藏原因——测量值范围太小，并提出了一个简单的可学习缩放参数QMT来解决。实验在蛋白质分类和Fashion MNIST上都有效果。

原文

10:42

arXiv cs.LG@Yuhui Yin, Vassilis M. Charitopoulos

论文提出Generative Robust Optimisation (GRO)框架，用深度生成模型（如Wasserstein Adversarial Autoencoder）的解码器图像作为不确定性集，能表达非线性、非对称和多模态依赖。框架包含五个评估标准：重建保真度、分布匹配、潜在空间规整性、鲁棒相关性和计算可处理性。在六个不确定性分布和六种生成架构的生产规划问题以及多周期设施选址实验中，系统关注全部五个标准能同时提升不确定性集的表达力和优化可解性。

论文 Generative Robust Optimisation 鲁棒优化生成模型不确定性量化 Wasserstein Adversarial Autoencoder

推荐理由：这篇论文用生成模型替换传统固定形状的不确定性集，给出了五个可操作的评估标准，生产规划实验数据扎实，搞鲁棒优化或不确定性量化的值得看看。

原文

10:41

arXiv cs.LG@Lei Li, Yuexiao Dong

研究者提出用f-散度诱导的非线性变换替换扩散模型的标准MSE去噪损失，在CIFAR-10数据集30%污染条件下，负指数散度(NED)将FID从93.0（KL散度）降至77.5。该方法基于局部散度构造，利用DDPM高斯反向核结构将每步条件f-散度简化为去噪误差的一维函数。Hellinger散度产生显式指数权重，连接至稳健M估计框架。实验显示NED优于Huber损失和截断MSE等常见鲁棒损失。

论文扩散模型 f-散度 CIFAR-10 FID 稳健训练

推荐理由：这篇论文改进了扩散模型的抗污染能力，用f-散度加权去噪在CIFAR-10上30%污染时FID从93降到77，比常用鲁棒损失好用。

原文

10:40

arXiv cs.LG@Yiteng Peng, Dongwei Xiao, Zhibo Liu, Zhenlan JI, Shuai Wang

HERTA是首个针对全同态加密（FHE）框架的自动化测试工具。它利用蜕变测试方法，设计了基于FHE语义的新型蜕变关系，以检测多层软件栈中的实现错误。在3个主流工业框架上的评估中，HERTA发现了21个先前未知的漏洞，部分已被开发者确认修复。分析表明这些漏洞对FHE服务的完整性和可用性构成严重安全威胁。

论文全同态加密 HERTA 漏洞检测自动化测试 FHE安全

推荐理由：这个工具能自动找出FHE框架的隐藏bug，已经发现了21个，开发者都确认了。搞隐私计算的值得一看。

原文

10:39

arXiv cs.LG@Yuhang Jiang, Xiaojing Chen

这篇论文发现，输入多样性（DI）通过随机调整大小和填充来提升迁移性，但这种假设依赖于替代模型的类型。在标准替代模型上增加DI概率可提高攻击成功率，但在鲁棒训练的替代模型上反而降低，形成剪刀曲线。在ImageNet上，盲目使用DI导致鲁棒源模型在CNN、ViT、Swin和ConvNeXt等目标上的平均攻击成功率下降10.3%。通过梯度几何分析，约67%的伤害来自resize操作，且直接梯度对齐测量证实resize对标准模型有利而对鲁棒模型有害。作者提出一种无需训练的规则CG-DI，在局部梯度一致性高时禁用DI，避免鲁棒替代模型的损失。

论文剪刀效应输入多样性迁移攻击鲁棒性 ImageNet

推荐理由：这篇论文讲了一个反直觉的现象：给攻击加随机缩放，对标准模型有用，对鲁棒模型反而有害。还给出了简单补救方法，搞对抗攻击的可以看看。

原文

10:38

arXiv cs.LG@Pengfei Li, Mohammad Khalil

Fed-CausalDiff是一种联邦因果扩散框架，专门用于“do-simulation”和政策评估。它将潜在状态演化分解为全局因果评分函数和局部混淆评分函数，实现解耦同步（DSS），客户端只聚合共享因果机制而保留本地特定混淆。在四个数据集上的实验显示，Fed-CausalDiff在ATE和政策价值估计精度上优于传统方法，并在通信成本与推理保真度之间取得更好平衡。

论文 Fed-CausalDiff 联邦学习因果推断扩散模型

推荐理由：这篇论文提出Fed-CausalDiff，让联邦学习不仅能拟合历史数据，还能做因果干预模拟。它在四个数据集上比常规方法更准，而且通信开销可控，适合分布式医疗或金融场景。

原文

10:38

arXiv cs.LG@Aygün Varol, Katarzyna Kołodziej, Łukasz Sobczak, Michał Romaszewski, Przemysław Głomb, Naser Hossein Motlagh, Mirka Leino, Johanna Virkki

这篇论文提出结构化提示构建框架，将原始空气质量和热舒适传感器数据转化为三种渐进的文本表示（原始值、阈值描述、环境摘要）。研究使用室内Raspberry Pi/BME680数据集和户外华沙等城市数据集，评估5个本地和5个云端LLM。在无思维链推理模式下，本地模型准确率从50.9%提升至81.7%（室内），从63.7%提升至89.3%（户外），平均延迟仅0.22秒。结果表明轻量级预处理可显著缩小边缘与云端的准确率差异。

论文 LLM IoT数据预处理边缘AI 提示工程环境监测

推荐理由：把传感器数据预处理成文字提示，小模型准确率能从50%涨到89%，延迟才0.22秒，不比云端差。

原文

10:37

arXiv cs.LG@Chandranath Adak, Ramesh Nandipalli

该研究提出两阶段深度学习流水线：先用微调后的VideoMAE视频Transformer将手语视频片段分类为英文标签（在AI4Bharat印度手语数据集的13类子集上达到99%训练精度和78%验证精度），再用Meta的NLLB-200模型将英文标签翻译为印地语、泰卢固语和孟加拉语。实验使用13类197个片段、80-20分割，15个epoch后完成训练，并通过混淆矩阵揭示主要失败模式（如ugly/deaf/blind等形容词混淆）。研究还提供了Streamlit演示入口，支持用户上传视频并输出预测标签及三种方言翻译。论文代码已开源。

论文 VideoMAE NLLB-200 AI4Bharat 手语识别跨语言翻译

推荐理由：想了解手语识别和低资源语言翻译怎么落地？这篇用VideoMAE+NLLB-200直接搭了个两阶段流水线，13类测试精度78%，还带Streamlit演示和代码。

原文

10:36

arXiv cs.LG@Muhammad Bilal, Ali Hassaan Mughal

该论文分析了一个生产级租赁搜索助手，其自动化测试套件在六周内增长到1,553个测试用例。尽管套件持续通过，用户可见缺陷仍不断进入生产环境。研究检查了项目中所有252个bug修复提交，发现约44%的修复属于四个无法被组件级单元测试观察的接缝：实时浏览器运行时、非默认市场、端到端流程和全系统级别。一个缺陷因缺少接缝防护而两次发布。论文提出了四接缝框架和实测缺陷分布。

论文 LLM 多市场 Web应用软件测试缺陷分析

推荐理由：这篇论文用252个真实bug数据，告诉你怎么测试全绿依然出bug，给所有做LLM应用的人敲响警钟。

原文

10:35

arXiv cs.LG@Talia Sternberg, Gallil Maimon, Yossi Adi

该论文分析了来自不同模型族和规模的交错语音文本语言模型，发现它们会在中间层隐式转录语音对应的文本词，其中77%的数据中该文本词出现在Top候选词中。随后模型在文本空间预测下一个词，再转回语音域。研究还表明，交错训练数据和文本LM初始化是诱发该行为的关键，且该行为与口语知识能力相关。

论文 Speech Language Models 交错训练语音模型多模态模型可解释性

推荐理由：这篇论文让你搞懂语音语言模型内部是怎么偷偷把语音转成文本再推理的，分析得很透彻，适合想深入理解多模态模型原理的人。

原文

10:34

arXiv cs.LG@Shengchao Zhao, Yongchao Liu

论文提出VRA-FedSGD算法，针对联邦学习中重尾梯度噪声和通信噪声问题。该算法采用动量方差缩减配合非线性映射减轻重尾梯度噪声，并使用方差缩减聚合机制抑制重尾通信噪声。在非凸目标函数下，均方收敛率为O(K^{-(p-1)/(2p-1)})，其中p为尾指数；在强凸目标函数下，几乎必然收敛率为O~(K^{-(1-1/(p-ε))})。在逻辑回归问题上的仿真实验验证了算法有效性。

论文 VRA-FedSGD 联邦学习方差缩减重尾噪声非凸优化

推荐理由：这篇论文搞了个VRA-FedSGD，专门对付联邦学习里常见的重尾噪声，收敛速度有理论保证，实验也跑通了，值得看看。

原文

10:32

arXiv cs.LG@Mathieu Delcluze, Léa Briand, Benjamin Chapus, Deniz Mekik, Guillaume Salha-Galvan

Deezer在2025年部署了基于大型语言模型（LLM）的自动播放列表标注系统。该系统为Daily Mix功能生成自然语言描述，覆盖数百万用户。部署后用户参与度显著提升，表明语义描述如何影响用户对个性化推荐的感知。论文发表于arXiv，编号2606.22460v1。

论文 Deezer LLM 播放列表生成推荐系统用户参与度

推荐理由：Deezer用LLM给每日推荐写标题，百万用户真用上了，参与度还涨了——不是PPT，是上线产品。

原文

10:24

arXiv: OpenAI@Moran Koren

该论文提出一种以验证为先的LLM辅助经济理论协议，并实例化为三种方法：单次严谨通道、对抗性验证器对（Claude Opus 4.8提议，OpenAI Codex反驳，作者仲裁）以及带评审门控的结构化多智能体项目。作者在一个开放示例——为Gans-Kominers等级膨胀模型设计Groves/Pigouvian激励相容机制——上评估该协议，三个运行均未产生严格直接揭示VCG/Clarke机制，对抗性通道自身证实了该点。结果揭示三个反复出现的现象：收敛发现、对抗验证的有效性、以及抛光不等于严谨。

论文 LLM 经济理论验证协议多智能体 Claude Opus

推荐理由：这篇论文为你演示了如何用LLM做经济理论研究，重点不是让模型生成答案，而是设计验证流程来确保结果可靠，三种方法对比很清楚。

原文

6月19日

11:46

arXiv cs.LG@Georgy Noarov, Aaron Roth

这篇论文提出了一种确定性多校准算法，达到最小最大最优的样本复杂度率 O~(ε⁻³)，解决了此前只有随机算法能达到该复杂度而确定性算法样本复杂度更差的开放问题。算法进一步推广到结果不可区分性（OI）和全预测器，给出了针对有限或有限覆盖测试集合的最优确定性预测器。这解决了CLNR26和OKK25等先前工作中明确提出的开放问题。

论文多校准确定性算法全预测结果不可区分性样本复杂度

推荐理由：这篇论文解决了机器学习里一个悬而未决的问题：确定性多校准算法终于能像随机算法一样高效了。如果你关心公平性、可信预测的样本效率，可以看看他们怎么做到的。

原文

11:46

arXiv cs.LG@Przemyslaw Musialski

精选

论文提出Lie-Algebra Attention，其中token被定义为矩阵李群G的元素gi，而非传统特征向量。注意力分数使用相对姿态的对数范数闭合形式sij = -‖log(gi^-1 gj)‖²/τ，无需学习核函数。该方法适用于非紧致非交换的仿射群Aff(2)，这是向量token方法无法达到的。在SE(2)、SO(3)和Aff(2)上的序列补全实验中，其参数比MLP核少50-80倍，且在SE(2)上性能更优，而向量token基线的不变性误差高达5-12个数量级。

论文 Lie-Algebra Attention 矩阵李群 SE(2)SO(3)群论注意力

推荐理由：这篇论文用群元素当token，不用那些复杂的学习核，参数还少50到80倍，做SE(2)、SO(3)和仿射群上的任务都更好，值得看看思路。

原文

11:45

arXiv cs.LG@Linda Lu, Karthik Sridharan

该论文提出名为'可预测性'（predictability）的隐私度量框架，与差分隐私（DP）不同，它通过考虑攻击者的核心知识（部分泄露的数据）来评估隐私泄漏。研究证明可预测性与DP在一般情况下不可比较，但在最坏情形（仅一位个体未泄露且所有查询为二值）下，可预测性隐含互信息差分隐私。作者引入基于广义矩估计（GMM）的渐近分析方法，适用于由平稳遍历混合过程产生的泄露数据。最后，他们设计了一种基于可预测性校准的输出扰动方案，可与DP结合使用以提供细粒度隐私控制。

论文差分隐私可预测性 GMM 隐私度量 AI安全

推荐理由：这篇论文提出了一个新的隐私度量'可预测性'，比差分隐私更细致，还能和它一起用，很适合关注AI隐私的研究者。

原文

11:43

arXiv cs.LG@Qingyang Zhu, Eric Karl Oermann, Kyunghyun Cho

该研究提出多任务上下文学习框架用于分层贝叶斯预测推理，将先验信息表示为上下文数据集的前缀。使用Transformer在序列先验和目标任务上训练，学会跨先验家族调整预测。在包含元分布外先验和高维潜在结构的评估中，该方法匹配oracle贝叶斯预测器，速度提升数个数量级。在真实世界时空温度预测基准上验证了实际效果。

论文贝叶斯推理上下文学习多任务学习 Transformer

推荐理由：这篇论文提出多任务贝叶斯ICL框架，速度比传统方法快几个数量级，还能适应新先验，在温度预测上表现很好。

原文

11:42

arXiv cs.LG@Liang Su

论文提出execution-state capsules，一种图绑定的检查点与恢复机制，能保存KV缓存、循环状态、卷积状态等完整执行状态。基于此实现的FlashRT运行时在RTX 5090上，恢复操作亚毫秒级，TTFT相比冷预填充在2k tokens时加速3.9倍，16k tokens时加速27倍。在Jetson AGX Thor和DGX Spark上保持相同正确性和结构特性。该方法不取代高吞吐KV缓存服务，而是为显式执行状态复用提供互补的低延迟方案。

论文 Execution-State Capsules FlashRT 设备端AI 低延迟推理检查点恢复

推荐理由：FlashRT用执行状态胶囊实现了亚毫秒级恢复，比传统KV缓存多保存循环状态，对交互式AI和机器人很关键。

原文

11:41

arXiv cs.AI@Joshua Engels, Callum McDougall, Bilal Chughtai, Janos Kramar, Senthoran Rajamanoharan, Cindy Wu, Arthur Conmy, Asic Q Chen, Jean Tarbouriech, Min Ma, Brendan O'Donoghue, João Gabriel Lopes de Oliveira, Rohin Shah, Neel Nanda

71°

论文分析 DiffusionGemma 的推理透明度，将其分解为变量透明度和算法透明度。初始发现 DiffusionGemma 的不透明串行深度是自回归 Gemma 4 的 28.6 倍。但通过可解释的 token 瓶颈映射信息流，可将不透明串行深度降至仅 Gemma 4 的 1.1 倍。算法透明度方面，扩散模型因每步所有 token 可变化而更复杂，研究识别了非时间顺序推理、token 与序列涂抹、中间上下文推理等新现象。可监控性测试表明 DiffusionGemma 与 Gemma 4 水平相当。

论文 DiffusionGemma Gemma 4 可解释性推理模型 Google

推荐理由：Google 团队这篇论文解释 DiffusionGemma 的推理黑箱有多大，发现能用 token 瓶颈把深度压到几乎和 Gemma 4 一样，还发现了扩散模型特有的奇怪推理方式。

原文

11:41