6月11日
10:59
10:59arXiv cs.AI@Kai Standvoss, Miriam Hägele, Rosemarie Krupar, Julika Ribbat-Idel, Jennifer Altschüler, Gerrit Erdmann, Hans Pinckaers, Evelyn Ramberger, Madleen Drinkwitz, Ádám Nárai, Alexander Möllers, Katja Lingelbach, Sebastian Kons, Lukas Hönig, Recepcan Adigüzel, Joana Baião, Alberto Megina Gonzalo, Marius Teodorescu, Marie-Lisa Eich, Paolo Chetta, Shakil Merchant, Verena Aumiller, Simon Schallenberg, Andrew Norgan, Klaus-Robert Müller, Lukas Ruff, Maximilian Alber, Frederick Klauschen
精选
Atlas H&E-TME 是一个基于 Atlas 病理基础模型的 AI 系统,能够从 H&E 染色的全切片图像中预测组织质量、区域和细胞类型,每张切片输出超过 4500 个细胞级定量指标。研究团队提出了双重验证框架:一方面利用免疫组化(IHC)信息构建多病理学家共识,作为分子层面的金标准;另一方面在超过 20 万条高置信度病理学家标注上测试,覆盖 8 种癌症类型、1500+ 病例。结果显示,Atlas H&E-TME 在 H&E 图像上的表现与病理学家相当甚至更优,且泛化能力强。这一系统将最普遍的 H&E 切片转化为可扩展的定量工具,为下一代组织生物标志物研究奠定基础。
推荐理由:病理分析终于有了可规模化的 AI 方案——Atlas H&E-TME 在 H&E 图像上达到专家级精度,做肿瘤微环境研究和临床转化的团队可以直接用上这套定量工具。
6月2日
5月22日
11:12
11:12arXiv cs.AI@Girish Narayanswamy, Maxwell A. Xu, A. Ali Heydari, Samy Abdel-Ghaffar, Marius Guerard, Kara Vaillancourt, Zhihan Zhang, Jake Garrison, Levi Albuquerque, Dimitris Spathis, Hong Yu, Hamid Palangi, Xuhai "Orson" Xu, David G. T. Barrett, Joseph Breda, Jed McGiffin, Yubin Kim, Yuwei Zhang, Naghmeh Rezaei, Samuel Solomon, Karan Ahuja, Tim Althoff, Jake Sunshine, Ming-Zher Poh, Benjamin Yetton, Ari Winbush, Nicholas B. Allen, James M. Rehg, Isaac Galatzer-Levy, Yun Liu, John Hernandez, Anupam Pathak, Conor Heneghan, Yuzhe Yang, Ahmed A. Metwally, Pushmeet Kohli, Mark Malhotra, Shwetak Patel, Xin Liu, Daniel McDuff
精选72°
研究人员提出了一种面向可穿戴健康数据的基础模型,该模型在来自500万参与者的超过1万亿分钟未标记传感器信号上进行了预训练。通过联合扩展模型容量和预训练数据量,该模型在35项健康预测任务上(涵盖心血管、代谢、睡眠、心理健康及生活方式等)表现出系统性性能提升。该模型支持少样本学习和生成能力,可稳健估计日常健康指标。研究还部署了一组LLM智能体来自动搜索基于模型嵌入的下游预测头,并展示了性能随LLM能力提升而增强。最后,将下游预测器集成到个人健康代理中,经1860次临床医生评分验证,模型响应更相关、更具上下文意识且更安全。
推荐理由:这项研究解决了可穿戴数据标注稀缺和个体差异大的核心难题,做健康AI或可穿戴设备开发的团队可以直接参考其预训练方法和少样本学习策略,值得关注。
5月20日
11:24
11:24arXiv cs.LG@Emaad Khwaja, Chris Lettieri, Gerald Woo, Eden Belouadah, Marc Cenac, Guillaume Jarry, Enguerrand Paquin, Xunyi Zhao, Viktoriya Zhukov, Othmane Abou-Amal, Chenghao Liu, Ameet Talwalkar, David Asker
精选76°
Toto 2.0 是一系列开源时间序列基础模型,参数规模从 4M 到 2.5B,展示了单一训练配方即可实现预测质量的可靠提升。该模型家族在 BOOM、GIFT-Eval 和 TIME 三个基准上刷新了最先进水平。研究团队详细描述了架构、训练数据、超参数迁移管道等设计决策。所有五个基础检查点均以 Apache 2.0 许可证开源。这项工作标志着时间序列预测领域正式进入规模扩展时代。
推荐理由:时间序列预测终于有了可扩展的基础模型,做金融、能源、运维等预测任务的团队可以直接用开源权重,值得关注。