全部 AI 动态 · AI 热点

6月29日

10:13

arXiv cs.LG@Gift Modekwe, Qiugang Lu

本研究提出一种迁移学习框架，用于基于单粒子模型含电解质（SPMe）的物理信息神经网络（PINN）训练。模型首先在通用电化学动力学数据上预训练，然后通过权重迁移、冻结部分层并微调剩余参数适配目标电池。使用PyBaMM验证表明，该方法能准确预测电压，保持电化学一致性。相比从头训练，迁移学习显著减少训练时间，实现跨电池高效泛化。

论文 PINN SPMe PyBaMM 锂离子电池迁移学习

推荐理由：这篇论文讲怎么用迁移学习加速电池PINN模型训练，能跨电池用，省时间还准，做电池仿真的可以看看。

原文

6月26日

10:38

arXiv cs.LG@Santosh Kapuria, Abhishek

本研究提出结合轻量物理仿真、卷积自编码器(CAE)深度特征学习、前馈神经网络和少量实验数据的多保真迁移学习框架。在板状结构损伤定位与尺寸评估中，CAE迁移学习相比CNN方案定位精度显著更优。模型在损伤定位任务上R²超过0.93，损伤尺寸评估R²超过0.99。未见损伤场景下仍保持高预测准确度，实现计算效率与实用性的平衡。

论文卷积自编码器迁移学习结构健康监测导波 CAE

推荐理由：这篇论文用轻量仿真数据预训练CAE再迁移到小样本实验数据，做到了损伤定位R²>0.93、尺寸R²>0.99，比CNN方案准很多，很值结构健康监测方向的人看看。

原文

09:46

arXiv cs.AI@Jesper Klicks, Sander Vržina, Vincent François-Lavet

这篇论文研究了深度强化学习中状态表示对抽水蓄能交易决策的影响，固定使用Double DQN智能体和HydroDam环境。对比绝对价格/日历特征、相对特征和预测特征三种特征家族，组合使用绝对+相对+预测特征在比利时2007–2011数据上训练，在2012–2025的相同市场测试集上达到55.6%的分数，跨39个ENTSO-E市场区域的分数中位数为47.5%，显著优于单独使用绝对特征（测试集28.8%，跨区中位数5.7%）或相对特征。结果表明状态表示是储水交易强化学习策略设计的核心，而非次要预处理选择。

论文 Double DQN HydroDam 状态表示强化学习迁移学习

推荐理由：想知道强化学习里状态怎么设计才能跨市场通用？这篇论文用Double DQN和HydroDam做了严谨对比，绝对+相对+预测特征组合最好。

原文

6月24日

11:44

arXiv cs.LG@Anurag Akula, Satheesh K. Perepu, Abhishek Sarkar, Kaushik Dey

ASALT是一种针对多智能体强化学习（MARL）的迁移学习方法，解决了源域和目标域观测空间与全局状态空间维度不匹配的问题。该方法引入观测层和状态层适配器，将目标域观测和全局状态映射到共享嵌入空间，支持跨异构域的策略迁移。在标准基准环境的多个配置上，ASALT在合作场景中相比现有基线提升了样本效率和全局回报，但效果依赖于源域与目标域的不匹配程度。实验还表明ASALT能缓解负迁移，这是跨不同观测和动作空间域迁移时的常见障碍。

AI模型 ASALT MARL 多智能体迁移学习强化学习

推荐理由：ASALT这个新方法解决了MARL中状态空间维度不同时知识迁移的难题，实验效果不错，值得做多智能体迁移学习的同学看看。

原文

11:40

arXiv cs.LG@Jinghan Wang, Feng Cheng, Wentao Wu, Hang Li, Gaoliang Peng, Tianchen Liu

该论文提出一种知识引导的两阶段迁移学习框架，核心是一个轻量级GPT-2风格Transformer，利用因果自注意力从振动信号中分层提取特征。框架通过多源预训练学习通用表示，并借助原型知识调制和分类自适应实现跨域迁移。在4个真实数据集上，仅用10%标签数据即达92.61%平均准确率，比现有最佳方法高17.24个百分点。该方法为工业4.0低成本预测性维护提供了可行方案。

论文 GPT-2 Transformer 轴承故障诊断迁移学习小样本学习

推荐理由：这篇论文把GPT-2用在轴承故障诊断上，只用10%的标签数据就比SOTA高了17个百分点，工业场景下很实用。

原文

6月19日

10:17

arXiv cs.AI@Giancarlo Santamato, Andrea Mattia Garavagno, Massimiliano Solazzi, Antonio Frisoli

论文提出一种在数据极度稀缺条件下设计基于深度迁移学习的振动智能故障诊断系统（IFDS）的新方法。该方法采用周期性多激励水平程序，利用真实系统的固有非线性特性生成图像，供预训练卷积神经网络（CNN）分析以诊断故障。同时提出一种新的数据可视化及增强技术以应对IFDS设计中典型的数据不足。在铁路受电弓结构上的实验验证了该方法的有效性。

论文迁移学习故障诊断数据稀缺非线性 CNN

推荐理由：这篇论文用系统非线性生成图像，数据极少也能做故障诊断，还在铁路受电弓上验证了，搞工业AI的可以看看。

原文

6月16日

20:46

AITOP6月16日 20:46

600亿美元买下Cursor，xAI终于拿到了编程工具，但真正值得跟踪的或许不是AI

6月12日

12:57

AITOP6月12日 12:57

Claude代码里藏了个20260612，18个月后的AI记忆革命已经开始倒计时

09:38

arXiv cs.LG@Abubakar Hamisu Kamagata, Dharm Singh Jat, Attlee Munyaradzi Gamundani, Abhishek Srivastava, Paramasivam Saravanakumar

该研究提出一种物理引导的深度时空学习框架，用于从被动海岸视频流直接估算近岸波浪峰值周期。框架结合了基于时间方差的感兴趣区域检测、多阶段模拟到真实迁移学习以及物理信息正则化，提升了预测精度和物理一致性。实验表明，基于Transformer的架构在瞬时预测精度上表现最佳，而轻量级循环卷积架构在时间稳定性和海洋学技能上更优。消融研究证实了物理引导正则化在趋势一致性方面的优势，可解释性审计显示模型关注了水动力活跃的破浪区。该工作展示了基于视频的深度学习系统在长期、低成本海岸波浪监测中的潜力。

论文物理引导深度学习波浪监测视频分析迁移学习 Transformer

推荐理由：做海岸工程或海洋监测的团队，终于有了一个成本低、可解释的AI方案——从视频直接估算波浪参数，比布设浮标省钱省力，值得关注。

原文

6月11日

15:28

AITOP6月11日 15:28

1107 vs 303：谷歌悄悄开源了一个“拆打字机”的模型，把大模型速度翻了4倍

15:23

AITOP6月11日 15:23

DiffusionGemma颠覆文本生成？自回归模型的“统治”要结束了

15:07

AITOP6月11日 15:07

每秒1107个token，Google开源的扩散模型为什么能改变本地推理格局？

09:49

arXiv cs.AI@Minh-Khoi Pham, Luca Cotugno, Alina Sirbu, Tai Tan Mai, Martin Crane, Marija Bezbradica

精选

该研究提出了一种轻量级适配方法，将表格基础模型（如TabPFN、TabDPT、TabICL）应用于临床生存分析，通过直接训练一个生存感知头（MTLR）来预测右删失的时间事件结果。在多个公开生存基准和两个大规模ICU队列（MIMIC-IV和eICU）上的评估显示，该方法在C-index指标上优于传统深度生存模型（如DeepSurv），相对提升达1.4%-1.7%。这表明预训练表格表示与生存感知目标的结合为临床生存预测提供了实用且有效的替代方案。

论文表格基础模型生存分析临床决策迁移学习 TabPFN

推荐理由：临床研究人员和医疗AI开发者终于有了一个无需从头训练就能做生存分析的方案——用表格基础模型加一个轻量头就能超越DeepSurv，做ICU预后预测的团队可以直接在MIMIC-IV和eICU上复现。

原文

6月9日

11:02

arXiv cs.AI@Tianyu Ruan, Fengzhuo Zhang, Shuche Wang, Shihua Zhang

精选72°

Muon 作为预训练大语言模型和视觉分类器的新兴优化器，其效率优势已超过 Adam 和 SGD，但特征学习优势尚不明确。本文通过鲁棒性和迁移性视角研究 Muon 的特征学习优势：在损坏图像和文本上评估预训练模型，发现 Muon 学到的特征比 Adam 和 SGD 更鲁棒，且这种优势体现在更大的 logit 边际上。通过下游任务的线性分类器或微调，Muon 的特征迁移效果更好，这得益于隐藏状态的有效秩更高。在含多组件的分类问题中，论文从理论上证明了 Muon 能获得更大边际和更高有效秩。

论文 Muon 优化器鲁棒性迁移学习特征学习

推荐理由：Muon 优化器在鲁棒性和迁移性上全面超越 Adam，做预训练或迁移学习的团队值得关注，尤其是需要模型对噪声和下游任务更鲁棒的场景。

原文

6月2日

11:09

arXiv cs.AI@Adrián Cánovas-Rodriguez, Miguel A. González-Illán, Maria Fernanda García-Cruz, Pedro Nortes Tortosa, José Salvador Rubio-Asensio, Miguel A. Zamora Izquierdo, Juan Antonio Martínez Navarro, Antonio F. Skarmeta

研究者提出基于注意力机制和迁移学习的桃叶损伤分类方法，解决不同田间环境下的域迁移问题。他们构建了包含 1,366 张桃叶、6 类损伤的公开基准数据集，并评估多种深度学习架构。EfficientNetB5 结合 CBAM 注意力模块取得最佳准确率 93.3%，在少数类上表现更强。针对本地 180 张图像的域迁移测试，EfficientNetB3+CBAM 通过微调策略达到 93% 的宏 F1 分数，证明注意力机制能提升模型跨域泛化能力。

论文注意力机制迁移学习农业AI EfficientNet CBAM

推荐理由：农业 AI 落地常卡在域迁移上——不同果园的光照、品种会让模型失效。这篇用 CBAM 注意力+迁移学习把桃叶病害分类的跨域准确率拉到 93%，做作物病害检测的团队可以直接参考其微调策略。

原文

5月27日

10:52

arXiv cs.LG@Lauren J Beesley, Alexander C Murph, Dave Osthus, Lauren A Castro

精选

该研究通过迁移学习，利用66种传染病的数据流训练预测模型，显著提升了20种疾病数据流的预测性能。研究发现，整合多数据流在84.9%的时间序列和模型结构中改善了预测效果，但数据质量至关重要，添加与目标数据差异过大的数据可能降低性能。研究者还公开了一个多疾病数据库，供传染病预测社区使用。

论文迁移学习传染病预测多数据流公开数据库机器学习

推荐理由：传染病预测模型常因数据单一而脆弱，这项研究用66种疾病数据做迁移学习，解决了数据短缺问题。做公共卫生预测或流行病建模的团队，可以直接用公开数据库试试。

原文

5月25日

11:19

arXiv cs.AI@Ming Yang, Tao Yu, Feng Li, Hua Chen

精选

全身跟踪（WBT）模型是人形机器人模仿多样动作的关键基础，但从头训练需要大量数据和计算资源。Any2Any 提出一种新范式，通过运动学对齐和轻量级参数高效微调（PEFT），将预训练的 WBT 模型快速迁移到新的人形机器人本体上。实验表明，仅需 1% 的计算和数据量，Any2Any 就能将基于 Unitree G1 预训练的 Sonic 模型成功迁移到 LimX Oli 和 LimX Luna 上，性能与从头训练相当甚至更优。这为快速部署人形机器人全身控制提供了可扩展的路径。

论文人形机器人全身跟踪迁移学习参数高效微调 Any2Any

推荐理由：人形机器人开发者终于有了低成本复用预训练模型的方法——Any2Any 用 1% 的数据和算力就能迁移全身跟踪能力，做机器人部署的团队可以直接参考。

原文

5月22日

11:07

arXiv cs.AI@Amir Mousavi, Mohammad Sadegh Sirjani, Erfan Nourbakhsh, Mimi Xie, Rocky Slavin, Leslie Neely, John Davis, John Quarles

精选

实时认知负荷评估对自适应人机交互至关重要，但受限于标注数据少和跨个体泛化差。CogAdapt提出LeadBridge适配器，将3导联可穿戴信号转换为12导联临床格式，并结合ProFine渐进微调策略，防止灾难性遗忘。在CLARE和CL-Drive数据集上，CogAdapt的宏F1分数分别达0.626和0.768，显著优于从头训练的基线模型。该工作证明了基础模型迁移在可穿戴设备上实现个体无关认知负荷评估的可行性。

论文 ECG基础模型认知负荷评估可穿戴设备迁移学习 CogAdapt

推荐理由：做可穿戴设备或脑机接口的团队，终于有了一个把临床大模型直接用到低导联设备上的实用方案——CogAdapt的LeadBridge适配器解决了传感器不匹配的痛点，建议做认知负荷评估的开发者直接参考。

原文

5月19日

12:46

arXiv: OpenAI@Benedict Florance Arockiaraj, Richard Chang, Wesley Yee

精选

该研究探索了深度强化学习中迁移学习的应用，通过在OpenAI赛车环境中训练智能体在一个赛道上，然后通过零样本迁移或微调在其他定制赛道上实现快速圈速。研究发现，基于模型的方法在性能和收敛速度上均优于无模型方法。迁移学习不仅提升了目标域的性能，还在学习过程中表现出高效性。

论文迁移学习深度强化学习赛车环境模型方法零样本迁移

推荐理由：做强化学习或自动驾驶的团队可以看看这篇——迁移学习让赛车智能体快速适应新赛道，模型方法收敛更快，值得一试。

原文