全部 AI 动态 · AI 热点

6月29日

10:08

10:08

arXiv cs.AI@Zuoou Li, Wenlong Zhao, Kelly Yu, Weitong Zhang, Paul M. Matthews, Wenjia Bai, Bernhard Kainz, Mengyun Qiao

CPAgents是一个由三个AI智能体（Analyst、Proposer、Verifier）组成的迭代框架，用于自动构建心血管表型关联研究中的可解释复合表型（如多项式、比值、交互形式）。在72个分类器-疾病-指标组合中，CPAgents生成的复合表型在56个组合中取得最优排名（基线仅18个），涵盖全部9个临床疾病类别。该方法能自动发现超出专家手工特征选择的更强表型-疾病关联，并生成透明的证据链。

AI模型 CPAgents 智能体表型关联心脏疾病可解释AI

推荐理由：这篇论文提出了CPAgents，用三个智能体自动组合心脏影像特征，相比传统方法在56/72测试中拿第一。适合关心AI辅助医学研究的读者。

6月16日

20:46

AITOP6月16日 20:46

600亿美元买下Cursor，xAI终于拿到了编程工具，但真正值得跟踪的或许不是AI

600亿美元买下Cursor，xAI终于拿到了编程工具，但真正值得跟踪的或许不是AI

6月15日

11:11

11:11

arXiv cs.AI@Rafi Ahamed, Md. Abir Rahman, Tasnia Tarannum Roza, Munaia Jannat Easha, Md. Asif Khan, Sudeepta Mandal

CottonLeafVision框架为棉花叶病分类而生，评估了DenseNet201、InceptionV3和VGG19等预训练模型。在包含6类病害和1类健康的7类公开数据集上，DenseNet201达到了98%的最高分类准确率。框架采用Grad-CAM、遮挡敏感分析和对抗训练来增强模型可解释性与噪声鲁棒性。最后，团队开发了原型，用于实际农业场景中的病害管理。

AI模型 CottonLeafVision DenseNet201 图像分类农业AI 可解释AI

推荐理由：98%准确率识别棉花叶病

6月12日

12:57

AITOP6月12日 12:57

Claude代码里藏了个20260612，18个月后的AI记忆革命已经开始倒计时

6月11日

15:28

AITOP6月11日 15:28

1107 vs 303：谷歌悄悄开源了一个“拆打字机”的模型，把大模型速度翻了4倍

15:23

AITOP6月11日 15:23

DiffusionGemma颠覆文本生成？自回归模型的“统治”要结束了

15:07

AITOP6月11日 15:07

每秒1107个token，Google开源的扩散模型为什么能改变本地推理格局？

6月10日

12:10

12:10

arXiv cs.LG@Kiarash Rezaei, Omran Ayoub, Sebastian Troia, Francesco Lelli, Paolo Monti, Carlos Natalino

精选

该论文提出一个结合大语言模型（LLM）和SHAP特征交互的生成式可解释AI框架，专为下一代网络运维设计。传统XAI方法输出技术性强，非专家难以理解，而该框架通过结构化提示融入互特征交互数据，生成自然语言解释。在光传输质量估计用例中，人类评估者验证其解释有用性提升12.2%，范围提升6.2%，正确率达97.5%。这解决了网络AI模型黑箱问题，让运营商能信任并采纳AI决策。

论文可解释AI LLM SHAP 网络运维特征交互

推荐理由：网络运维团队终于有了能看懂AI决策的工具——LLM把SHAP的复杂特征交互翻译成自然语言，做网络AI可解释性的开发者可以直接参考这个框架。

6月9日

11:55

11:55

arXiv cs.AI@Beiwen Zhang, Yongheng Liang, Guowei Zou, Haitao Wang, Hejun Wu

精选

研究者提出Collaboration Policy Tree (Co-pi-tree)，一种将大语言模型推理蒸馏为可执行策略树的方法，用于人机协作。该方法包含伙伴行为预测树和智能体动作选择树，通过闭环交互反馈自动改进策略分支。在Overcooked-AI实验中，Co-pi-tree相比基线平均奖励提升35.4%，同时将LLM查询次数减少77.7%，测试延迟降低97.1%。这解决了传统多智能体强化学习缺乏可解释性、以及直接使用LLM决策成本高的问题。

论文人机协作策略树 LLM蒸馏可解释AI Overcooked-AI

推荐理由：做AI协作系统或人机交互研究的团队值得关注——Co-pi-tree用可解释的策略树替代黑箱模型，既提升性能又大幅降低推理成本，实验数据很有说服力。

6月2日

11:08

11:08

arXiv cs.AI@Hallah Shahid Butt, Qiong Huang, Gökhan Demirel, Kevin Förderer, Erfan Tajalli-Ardekani, Simnon Waczowicz, Luigi Spatafora, Veit Hagenmeyer, Benjamin Schäfer

该论文提出了一种可解释的深度强化学习（XRL）框架，用于优化住宅建筑的能源管理，特别是配备光伏和储能系统的建筑。研究对比了在线策略（如A2C和PPO）与离线策略算法，发现前者在累积奖励和策略稳定性上更优。框架利用事后解释技术揭示黑箱模型的决策过程，不仅降低了电费，还提供了透明、可操作的见解。实验基于合成数据和德国KIT的Living Lab真实数据，验证了方法的有效性。

论文深度强化学习可解释AI 建筑能源管理储能优化 PPO/A2C

推荐理由：建筑能源管理团队终于有了可解释的AI方案——XRL框架在降低电费的同时让你看清决策逻辑，做楼宇自动化或智慧能源的开发者可以直接参考。

09:43

09:43

arXiv cs.AI@Federica Tonti, Ricardo Vinuesa

该研究提出结合多智能体深度强化学习（MARL）与可解释深度学习（XDL）的方法，用于减少壁面湍流中的阻力。通过SHAP归因分析，比较了三种奖励设计策略，其中基于摩擦系数和壁面压力波动组合的SHAP策略表现最佳，实现了34.44%的减阻率和34.01%的净节能率，且归一化输入功率仅0.43%。相比传统对抗控制，减阻和净节能分别提升49.41%和48.52%，同时将归一化执行成本从5.90%降至0.43%。分析表明，节能策略与压力门控执行一致，主要在壁面压力接近零时激活，时间尺度与近壁湍流结构寿命相当。

论文深度强化学习可解释AI 湍流减阻 SHAP归因节能控制

推荐理由：流体力学和AI交叉领域的研究者值得关注——该工作用可解释AI找到了湍流减阻的节能控制策略，比传统方法效率提升近50%，且执行成本降低一个数量级。

6月1日

10:19

10:19

arXiv cs.LG@Federico Califano, Jacopo Ciambella

该研究提出一种基于语法符号回归的框架，用于从数据中发现满足热力学约束的耗散势函数。框架通过构造凸性保持的语法规则，自动保证候选势函数满足热力学第二定律的凸性和非负性要求，适用于率相关和率无关的耗散机制。在合成数据集和实验数据上的验证表明，该方法能准确恢复牛顿、幂律和宾汉粘塑性本构，并在弹性体振荡剪切实验中优于线性Zener模型。这项工作为数据驱动本构建模提供了兼顾可解释性和物理一致性的新路径。

论文符号回归本构建模热力学约束耗散势可解释AI

推荐理由：做材料本构建模或计算力学的团队，终于有了一个既能保证热力学约束又不牺牲可解释性的符号回归工具，值得在实验数据上试试。

5月28日

11:31

11:31

arXiv cs.AI@Tirtharaj Dash

精选

BIRDNet 是一种新型神经网络架构，通过挖掘特征间的布尔蕴含关系（BIR）构建知识图，并将其编码为网络连接。该方法使用稀疏异常二项检验挖掘关系，形成有向图，等价于命题规则库。BIRDNet 的每层隐藏单元对应一条规则，仅连接两个特征，因此架构天然稀疏，最多只有 2/d 的权重活跃。模型保持可解释性，每个训练单元保留稳定的符号身份，规则可直接从网络读取。在六个转录组和蛋白质组基准测试中，BIRDNet 在 AUROC 上仅比最强基线低 0.02，但活跃参数减少高达 96 倍，且第一层规则能恢复已知生物标志物。

论文可解释AI 布尔蕴含稀疏网络生物信息学知识图

推荐理由：BIRDNet 解决了深度神经网络可解释性与稀疏性的矛盾，做生物信息学或知识图谱的团队可以直接用它的开源代码，在保持高精度的同时获得可读的规则。

5月25日

11:15

11:15

arXiv cs.AI@Laura R. Marusich, Mary Grace Kozuch Dhooghe, Jonathan Z. Bakdash, Murat Kantarcioglu

精选

一项大规模人类行为实验评估了LLM生成的叙事解释对分类任务决策表现的影响。研究发现，无论叙事解释的说服力高低，其提升决策准确性的效果并不优于仅提供AI预测。叙事解释增加了用户对AI的依赖，但无论AI预测正确与否，这种依赖都会增强。探索性分析还表明，更具说服力的叙事可能延长决策响应时间，并削弱用户区分正确与错误预测的能力。该研究指出，在AI预测中加入叙事解释可能带来决策表现的权衡，需要更多工作来理解其影响机制。

论文 LLM 叙事解释人机决策可解释AI 行为实验

推荐理由：做AI辅助决策系统或人机协作研究的团队，这篇论文揭示了叙事解释可能带来的隐藏成本——它不一定提升准确率，反而可能拖慢决策并增加盲目信任，值得仔细读读实验设计。

5月21日

10:22

10:22

arXiv cs.LG@Yinsong Chen, Samson S. Yu, Zhong Li, Chee Peng Lim

精选

该论文提出一个统一框架，将贝叶斯神经网络（BNN）后验分布通过Lipschitz连续归因算子映射为解释分布，并引入不确定性感知相关性归因算子（UA-RAO），利用均值、方差、变异系数、分位数和集合聚合度量来总结解释分布。理论部分提供了蒙特卡洛可达性和Wasserstein近似界限。在15类电能质量扰动分类基准上，深度集成与均值UA-RAO相比确定性基线提升了定位性能，其他UA-RAO摘要揭示了点估计归因中缺失的不确定性模式。该框架是领域无关的，可应用于任何BNN与Lipschitz连续归因算子的组合。

论文可解释AI 贝叶斯神经网络不确定性量化归因算子电能质量

推荐理由：该框架解决了XAI方法缺乏不确定性量化的问题，做可解释AI或电力系统故障诊断的研究者可以直接参考其理论证明和实验设计。

5月20日

15:51

15:51

arXiv cs.AI@Gabriel Freedman, Adam Dejl, Adam Gould, Mansi, Lihu Chen, Jianqi Jiang, Francesca Toni

精选

该论文提出推理时论证（ITA），一种可训练的神经符号框架，用于三元声明验证（真/假/不确定）。ITA 使用形式论证语义指导 LLM 生成论证并分配基础分数，同时计算三元预测。训练时，论证生成和评分根据预测质量优化；推理时，最终预测忠实于决定判决的论证和分数，而非事后推理痕迹。在两项三元声明验证数据集上，ITA 优于论证基线，并与非论证直接预测基线竞争，同时提供可检查的论证结构。

论文神经符号学习声明验证三元分类可解释AI 推理时论证

推荐理由：这个框架解决了高可信场景下声明验证的忠实性和不确定性表达问题，做事实核查、医疗或金融 AI 的团队可以直接参考其可解释的推理机制。

11:09

11:09

arXiv cs.LG@Antonio Peña Corredor, Julien Lesseur, Romain Nunez, Paul Rivalland, Thomas Philippe

精选

航空SiC/SiC复合材料的X射线CT无损检测依赖专家目视评估，缺乏可追溯性。研究团队提出p-ResNet-50，在卷积网络中引入原型层，将高检测精度与基于案例的解释结合。六个学习原型与专家定义的语义类别（健康基体、基体-空气界面、孔隙、线状缺陷、混合形态）对齐，每个分类都可追溯到物理有意义的参考。通过锚点和中心点正则化项防止原型坍缩，UMAP潜空间分析明确标出模型可靠与不可靠区域。在约12000个补丁的数据集上，p-ResNet-50达到与黑盒ResNet-50相当的精度（0.957 vs 0.959），同时提供可追溯决策和不确定性标记。

论文可解释AI 缺陷检测 X射线CT 原型网络 SiC/SiC复合材料

推荐理由：做工业无损检测或AI可解释性研究的团队会感兴趣——p-ResNet-50在保持高精度的同时让黑盒模型变得可审计，航空质检场景可以直接参考其原型对齐方法。

5月19日

14:34

14:34

arXiv cs.AI@Amritpal Singh, Andrey Barsky, Mohamed Ali Souibgui, Ernest Valveny, Dimosthenis Karatzas

精选

可解释AI（XAI）技术对深度学习模型的验证和负责任使用日益重要，但缺乏可靠的评估标准。研究者提出了一种基于连续输入扰动的量化指标，用于衡量XAI方法的质量，该指标从充分性和必要性两个维度评估归因信息对模型决策的影响。实验表明，该指标比现有方法更符合人类对解释质量的直觉。基于此指标，团队还提出了一种新的XAI方法，通过可微分的近似指标作为监督信号微调模型，在不降低模型性能的前提下生成因果解释。该方法在多个量化指标上优于现有XAI技术。

论文可解释AI 量化评估因果解释模型微调深度学习

推荐理由：这项研究解决了XAI领域缺乏可靠评估标准的痛点，做模型可解释性研究的团队可以直接用这个指标来量化自己的方法，值得关注。

10:59

10:59

arXiv cs.LG@Samuele Bortolotti, Emanuele Marconato, Andrea Pugnana, Andrea Passerini, Stefano Teso

精选

神经符号概念模型（NeSy-CBMs）结合神经网络与符号推理，适用于高风险场景，但其预测可能过于自信。研究者引入共形预测（CP）框架，提出三个理想目标：一致性、覆盖率和简洁性。现有方法无法同时满足这些目标，因此他们提出COCOCO，一种事后框架，联合共形化概念和标签，并通过演绎-溯因修正步骤协调两者。COCOCO满足所有三个目标，保持无分布覆盖率，对不完美知识具有鲁棒性，并支持用户指定的大小预算。在8个数据集上的实验表明，COCOCO在性能和集合大小方面优于竞争对手和基线方法。

论文共形预测神经符号模型概念模型可解释AI COCOCO

推荐理由：这项研究解决了高风险AI应用中模型过度自信的痛点，做可解释AI或安全关键系统的团队可以直接参考COCOCO框架来提升预测可靠性。

10:05

10:05

arXiv cs.AI@S. Tazili, A. Mansour, M. Y. Chkouri

精选

本文综述了AI在网络安全中的当前趋势，特别聚焦于入侵检测应用。研究涵盖了生成式AI、自然语言处理、联邦学习和可解释AI等关键技术，这些技术正被用于提升威胁检测的准确性和可解释性。通过对比分析不同AI技术在入侵检测中的性能，论文揭示了当前方法的优势与局限。该综述为网络安全从业者和研究者提供了有价值的参考，帮助他们理解AI如何增强防御能力。

论文网络安全入侵检测生成式AI 联邦学习可解释AI

推荐理由：这篇综述系统梳理了AI在入侵检测中的最新进展，做网络安全或AI安全应用的团队可以快速了解技术趋势，直接用于选型或研究方向参考。

10:04

10:04

arXiv cs.AI@Nisreen Albzour, Sarah S. Lam

精选

本研究系统优化了轻量级Vision Transformer（ViT-Tiny）用于宫颈癌细胞自动分类，在Herlev数据集上达到94.9%-95.2%的交叉验证准确率。通过对比数据增强、类别加权和超参数，发现随机水平翻转和类别权重(0.7×1.3)组合最有效。Grad-CAM分析显示模型注意力聚焦于细胞核、细胞边界和染色质纹理等临床相关形态特征。这项工作表明Vision Transformer能在保持临床性能的同时提供可解释的决策支持，满足医疗AI部署对透明度的要求。

论文 Vision Transformer 宫颈癌分类可解释AI 医疗影像 Grad-CAM

推荐理由：医疗AI团队终于有了兼顾准确率和可解释性的宫颈癌筛查方案——ViT-Tiny在轻量级下达到95%准确率，且注意力热图与病理标准对齐，做细胞学自动分析的开发者可以直接参考其优化策略。

5月15日

09:50

09:50

arXiv cs.AI@Yu Zhang, Dongjiang Zhuang, Qu Zhou, Zheng Huang, Junhe Wu, Jing Cao, Kai Chen

精选

该论文提出了一种确定性智能体工作流，用于解决HS关税分类这一高难度专家任务。传统端到端大模型提示方法在多维规则推理中常失败，而该工作流通过固定控制流、将语言模型调用限制在狭窄阶段，并保留局部反思与验证机制，实现了可解释性。在HSCodeComp数据集上，使用Qwen3.6-plus模型达到六位数64.2% top-1和78.3% top-3准确率；开源模型Qwen3.6-27B-FP8在非思考模式下与前沿模型有高度一致性。手动审计发现部分基准标签可能偏离HS通用规则，相关记录已公开。

论文智能体工作流 HS关税分类可解释AI 规则推理开源模型

推荐理由：做国际贸易合规或海关数据自动化的团队，终于有了一个可解释、可审计的AI分类方案，比黑箱模型更可靠，建议直接看论文的六阶段流水线设计。

5月11日

11:44

11:44arXiv cs.AI（学术论文）

研究人员提出PSP-HDC框架，利用图结构超维计算解决材料加工-结构-性能预测中的数据稀疏和异质性问题。该框架将PSP依赖关系编码为内部先验，通过可训练的标量到超向量编码器学习参数嵌入，并基于图对齐的绑定与捆绑进行样本表示。在3D制造平台测试中，PSP-HDC在随机分割和过程泛化下准确率达0.910和0.896，优于传统模型。该方法提供了内在可解释性，可追溯至参数和组级别的归因。

论文超维计算材料科学预测可解释AI 图结构化学习少量数据学习

推荐理由：该工作针对材料科学中数据高效预测的难题，提出了一种结合图结构与超维计算的新方法，在可解释性和少量数据泛化上表现突出，对AI在工程材料领域的应用具有参考价值。