5月29日
12:14
12:14arXiv cs.LG@Chris Varghese, Leo Y. Li-Han, Richa Bisht, Ellen Larson, Frank Lee, Ryan M. Carr, Tanios S. Bekaii-Saab, Shounak Majumder, John D. Halamka, Mark Truty, Ajit H. Goenka, Hojjat Salehinejad, Cornelius A. Thiels
72°
该研究开发了一种基于Transformer的神经网络模型,通过分析患者多年的诊断编码和血液检测值序列,预测未来1-3年内患胰腺癌的风险。模型在6017名胰腺癌患者和17.7万对照人群上训练,外部验证显示1年预测AUC达0.837,校准良好。设定3.3%风险阈值时,诊断优势比为18.2,为胰腺癌人群筛查提供了首个数字化富集工具。
推荐理由:胰腺癌早期发现是提高生存率的关键,这项研究用常规医疗数据就能实现风险分层,做癌症筛查或临床决策支持的团队值得关注。
11:06
11:06arXiv cs.AI@Keshigeyan Chandrasegaran, Kyle Sargent, Suchir Agarwal, Michael Jang, Michael Poli, Juan Carlos Niebles, Justin Johnson, Jiajun Wu, Li Fei-Fei
精选72°
斯坦福大学发布GPIC(Giant Permissive Image Corpus),一个包含约28万亿像素、1亿训练样本的开放许可图像数据集。所有图像均采用宽松许可,可自由用于研究和商业用途,并经过安全过滤和去重处理。数据集托管在Hugging Face上,附带基准测试协议和像素空间流匹配的参考基线。这为视觉生成模型的可扩展研究提供了稳定、大规模且合规的数据基础。
推荐理由:做视觉生成模型训练的研究者终于有了一个大规模、开放许可、可直接商用的数据集,不用再为版权和合规问题头疼。建议做图像生成、扩散模型或流匹配的团队直接下载使用。

仅展示最近 2000 条内容。更早的内容请查阅 AI 日报存档(侧边栏 → AI 日报 → 顶部「往期日报」)。