AI模型精选

FADA:统一视觉语言模型实现胎儿超声解读与标注,单GPU可训练

FADA: Accessible fetal ultrasound interpretation and annotation with a selectively distilled unified vision-language model

精选理由

FADA 解决了中低收入国家超声技师短缺导致的产前筛查缺口,做医疗 AI 或边缘部署的团队可以直接在手机上跑完整流程,值得关注其开源代码和模型。

AI 摘要

FADA 是一个基于 Qwen3.5-VL 构建的统一视觉语言模型,能够通过单一流程完成胎儿超声图像的临床解读、分类、检测和分割,无需外部标签。它通过选择性蒸馏技术从四个领域专用基础模型中提取知识,在分割任务上达到 0.8820 平均 Dice,检测 mAP@0.50 为 0.7671,解读合规率 100%。专家验证显示,在 237 张图像上,临床指导模式下 73.5% 的解读获得满分。该系统可在单张消费级 GPU 上训练,并能在搭载骁龙 7 Gen 1 的智能手机上离线运行完整流程约 60 秒,为资源受限地区的产前超声筛查提供了可行方案。

AI 翻译 · 中文

FADA 是一个基于 Qwen3.5-VL 构建的统一视觉语言模型,能够通过单一流程完成胎儿超声图像的临床解读、分类、检测和分割,无需外部标签。它通过选择性蒸馏技术从四个领域专用基础模型中提取知识,在分割任务上达到 0.8820 平均 Dice,检测 mAP@0.50 为 0.7671,解读合规率 100%。专家验证显示,在 237 张图像上,临床指导模式下 73.5% 的解读获得满分。该系统可在单张消费级 GPU 上训练,并能在搭载骁龙 7 Gen 1 的智能手机上离线运行完整流程约 60 秒,为资源受限地区的产前超声筛查提供了可行方案。

arXiv cs.AIA global shortage of trained sonographers limits prenatal ultrasound screening in low- and middle-income countries, where over half of pregnant women receive no skilled sonography. Current deep learning approaches addres