01:48Greg Brockman@gdbOpenAI 与波士顿儿童医院合作,使用 o3 Deep Research 工具帮助诊断罕见遗传病。相关成果发表在《NEJM AI》期刊上。该工具通过分析全外显子组测序数据,协助医生识别致病基因变异。研究团队在视频中展示了具体诊断案例。论文OpenAIo3罕见遗传病AI诊断NEJM AI5 个信源在谈推荐理由:OpenAI 把 o3 模型用到罕见病诊断上,还发了 NEJM AI 论文,很实在的应用。原文
10:49arXiv: DeepSeek@Adrien Bazoge, Josselin Corvellec, Sofiane Djillali Sid-Ahmed, Pierre-Antoine Gourraud精选一项新研究评估了提示语言对大型语言模型临床诊断推理和最终诊断准确性的影响,比较了英文和法文下五个模型(o3、DeepSeek-R1、GPT-4-Turbo、Llama-3.1-405B-Instruct、BioMistral-7B)的表现。180个临床案例由两位医生使用18分量表评估,涵盖16个医学专科。结果显示,除o3外,其他四个模型在英文提示下表现更好,平均差异0.37-0.91分,差异体现在鉴别诊断、逻辑结构和内部有效性等多个推理维度。这表明提示语言仍是LLM临床性能的关键决定因素,对全球语言文化公平部署具有重要影响。论文LLM临床决策支持多语言诊断推理o3推荐理由:医疗AI开发者需要注意:你的模型在非英语场景下可能掉链子,o3是唯一不受语言影响的例外。做多语言临床决策支持的团队,这篇论文值得细读。原文