论文精选

Hypnos:用下一词预测学习睡眠生理学通用表征

Next-Token Prediction Learns Generalisable Representations of Sleep Physiology

精选理由

睡眠医学和生理信号分析的研究者终于有了一个无需大量标注数据就能学到通用表征的基础模型——Hypnos 用下一词预测解决了多模态生理数据的学习难题,做睡眠分期或房颤检测的团队可以直接用它生成嵌入,大幅降低标注成本。

AI 摘要

该研究提出 Hypnos,一个多模态睡眠基础模型,使用来自 2 万多次夜间多导睡眠监测的 8 种传感模态(如 EEG、ECG、呼吸信号)训练。与现有使用掩码重建或对比学习的方法不同,Hypnos 采用下一词预测作为自监督目标,通过残差向量量化将每种模态离散化为 token 流,并用自回归 RQ-Transformer 并行预测所有模态的下一个 token。在睡眠阶段分类任务中,Hypnos 仅用 1% 的标注数据就达到了强监督基线的性能,还能泛化到日间生理信号,在检测房颤上超越专门的 ECG 基础模型。结果表明,下一词预测是多模态生理信号表征学习的有效且可扩展的自监督目标。

AI 翻译 · 中文

该研究提出 Hypnos,一个多模态睡眠基础模型,使用来自 2 万多次夜间多导睡眠监测的 8 种传感模态(如 EEG、ECG、呼吸信号)训练。与现有使用掩码重建或对比学习的方法不同,Hypnos 采用下一词预测作为自监督目标,通过残差向量量化将每种模态离散化为 token 流,并用自回归 RQ-Transformer 并行预测所有模态的下一个 token。在睡眠阶段分类任务中,Hypnos 仅用 1% 的标注数据就达到了强监督基线的性能,还能泛化到日间生理信号,在检测房颤上超越专门的 ECG 基础模型。结果表明,下一词预测是多模态生理信号表征学习的有效且可扩展的自监督目标。

arXiv cs.AIFoundation models offer a promising route to compress multi-modal physiological signals into compact representations of human health, with broad applications across sleep medicine, cardiology, neurology and other healthc