X·KOLX:arXiv cs.LG (@Rui Wu, Zongyuan Chen, Hong Xie, Defu Lian, Enhong Chen)
A-IHF (Adaptive Anisotropic Instrumental Heat Flow) 是一种用于控制函数工具变量估计的确定性图扩散残差提取方法。它利用图结构对处理变量进行各向异性扩散,通过检测处理值的大跳跃并衰减跨跳跃的导纳,生成稀疏图求解的残差。在包含图、核、树、提升、级联和神经网络等控制函数基线的54个合成基准单元中,受保护观测型A-IHF取得了最低的平均结构响应均方误差(MSE),并在32个单元中优于最佳非A-IHF基线。
X·KOLX:arXiv cs.LG (@Junming Zhang, Siyu Yi, Wei Ju, Zhonghui Gu)
PepALD是一种自回归潜在扩散基础模型,用于从头生成大环肽。该模型使用结构化学嵌入表示HELM单体,在化学信息潜在空间中通过上下文条件扩散生成每个残基。它能在自回归生成过程中预测R基团感知的环闭合,并通过获胜者保护的扩散适应偏好优化与亲和力奖励对齐。实验表明PepALD在生成质量和奖励优化上优于代表性肽生成基线。
X·KOLX:arXiv cs.LG (@Jinsu Kim, Jihoon Tack, Noah Lee, Jongheon Jeong)
Persona-Pruner 是一种通过隔离特定角色子网络来剪枝 LLM 的框架,在 RoleBench 上使性能下降比最强基线减少 93.8%(LLM-as-a-judge 分数),同时保持通用能力。实验表明,相比现有剪枝技术,它能更有效地保留给定角色的对话风格与知识。该方法无需全参数模型即可支持众多非玩家角色(NPC)的实时交互。
X·KOLX:arXiv cs.AI (@Sicheng Yang, Hangjie Yuan, Wenjun Zhang, Jinwang Wang, Yichen Qian, Weihua Chen, Fan Wang, Lei Zhu)
ClinHallu是一个用于诊断医疗多模态大模型(MLLM)推理中分阶段幻觉的基准,包含7031个验证实例。每个实例的推理轨迹被分解为视觉识别、知识回忆和推理整合三个阶段。通过阶段替换干预,可测量纠正特定阶段对最终答案的影响。轨迹监督微调能有效减少阶段幻觉。该基准为诊断和缓解医疗MLLM推理错误提供了细粒度测试平台。
X·KOLX:arXiv cs.AI (@Rafi Ahamed, Md. Abir Rahman, Tasnia Tarannum Roza, Munaia Jannat Easha, Md. Asif Khan, Sudeepta Mandal)
CottonLeafVision框架为棉花叶病分类而生,评估了DenseNet201、InceptionV3和VGG19等预训练模型。在包含6类病害和1类健康的7类公开数据集上,DenseNet201达到了98%的最高分类准确率。框架采用Grad-CAM、遮挡敏感分析和对抗训练来增强模型可解释性与噪声鲁棒性。最后,团队开发了原型,用于实际农业场景中的病害管理。