11:12arXiv cs.LG@Shadi Heenatigala, Hasanika Samarasinghe该研究利用一年高分辨率运营数据,提出统计与机器学习框架表征氢基多能源系统。统计分析显示太阳辐照度解释了氢产量45.7%的秩基方差,且仅高辐照期触发电解槽有效运行。随机森林模型将风能输出排在预测重要性首位,尽管其二元相关性仅为r=0.167,揭示了非线性动力学。序列模型利用24小时自相关r=0.845实现运营预测,强化学习代理优化了氢收益调度。论文随机森林强化学习序列模型氢能机器学习推荐理由:用随机森林和强化学习优化氢能调度原文
11:31arXiv cs.LG@Christian Janos Lebeda, David Erb, Tudor Cebere, Aurélien Bellet精选Lumberjack 是一种新的差分隐私随机森林算法,通过构建大型随机决策树并应用激进的隐私保护剪枝,显著提升了模型效用。其核心创新是一种针对层次数据的重击检测算法,误差随树高对数增长,支持使用更深的树。在基准数据集上的实验表明,Lumberjack 在隐私预算实用时大幅优于现有方法,建立了新的最优水平。这项工作表明精心设计的差分隐私随机森林可以缩小效用差距,为隐私保护机器学习提供了有前景的新方向。论文差分隐私随机森林重击检测隐私保护机器学习Lumberjack推荐理由:处理敏感表格数据的团队终于有了实用的差分隐私方案——Lumberjack 在隐私预算下显著提升随机森林效用,做隐私保护机器学习的开发者可以直接参考其方法。原文
10:11arXiv: OpenAI@Matteo Cobelli, Stefano Sanvito精选Autoresearch 是一种自动化科学任务的范式,AI 智能体自主提出、实现、评估和优化解决方案。本文提出 Automat 框架,使用基于 GPT-5.5 的 Codex 编码智能体,为化学化合物生成仅基于化学式的成分描述符,并通过随机森林工作流评估。在预测无机材料带隙和铁磁化合物居里温度两个任务中,Automat 超越了分数成分、Magpie 等基线,生成的描述符具有化学可解释性。该研究证明 autoresearch 智能体无需手动特征工程即可生成任务专用描述符,但也暴露了描述符冗余、贪婪特征扩展敏感性和需要复杂度控制等局限性。论文Autoresearch材料科学描述符设计GPT-5.5随机森林推荐理由:材料科学家和 AI for Science 研究者终于有了一个能自动设计描述符的框架——Automat 用 GPT 智能体替代了繁琐的手动特征工程,在带隙和居里温度预测上直接超越经典 Magpie 基线,做材料信息学的团队值得一试。原文