OncoSynth:用于肿瘤治疗效应估计的合成数据生成方法

OncoSynth: Synthetic data generation for treatment effect estimation in oncology

精选理由

这篇论文推出了OncoSynth,能用合成数据准确估计肿瘤治疗效果,比现有方法误差降低一半以上,适合做医疗AI的朋友了解。

AI 摘要

OncoSynth是一种因果感知的生成式机器学习框架,采用扩散序列方法模拟协变量对治疗分配的影响以及治疗对生存的影响。在大规模肺癌(N=37,128)和乳腺癌(N=17,046)队列上评估,OncoSynth生成的合成患者队列能保留真实世界的患者、治疗和结局分布。与现有方法相比,OncoSynth将群体水平治疗效应估计误差降低最多66%,患者水平误差降低最多58%。该方法支持在数据共享受限场景下为精准肿瘤学提供可靠证据。

AI 翻译 · 中文

OncoSynth是一种因果感知的生成式机器学习框架,采用扩散序列方法模拟协变量对治疗分配的影响以及治疗对生存的影响。在大规模肺癌(N=37,128)和乳腺癌(N=17,046)队列上评估,OncoSynth生成的合成患者队列能保留真实世界的患者、治疗和结局分布。与现有方法相比,OncoSynth将群体水平治疗效应估计误差降低最多66%,患者水平误差降低最多58%。该方法支持在数据共享受限场景下为精准肿瘤学提供可靠证据。

arXiv cs.AIIn oncology, access to patient-level data is often restricted. Synthetic data provides an alternative for analyzing treatment effectiveness, but existing methods for synthetic data generation fail to preserve the causal