Nature Medicine研究发现通用LLM在临床任务上超越专用医疗AI

A Nature Medicine study found general-purpose LLMs…

精选理由

通用模型在医疗任务上反超专用AI

AI 摘要

《自然医学》一项研究对比了OpenEvidence、UpToDate Expert AI与GPT-5.2、Gemini 3.1 Pro、Claude Opus 4.6在医学考试题、临床风格回答及医生真实提问上的表现。在100个脱敏临床问题中,盲审医生更偏好前沿通用模型,尤其在完整性和清晰度上胜出。结果显示通用LLM在医生评审的临床任务中已超越专用医疗AI产品。

AI 翻译 · 中文

《自然医学》一项研究对比了OpenEvidence、UpToDate Expert AI与GPT-5.2、Gemini 3.1 Pro、Claude Opus 4.6在医学考试题、临床风格回答及医生真实提问上的表现。在100个脱敏临床问题中,盲审医生更偏好前沿通用模型,尤其在完整性和清晰度上胜出。结果显示通用LLM在医生评审的临床任务中已超越专用医疗AI产品。

rohanpaul_aiA Nature Medicine study found general-purpose LLMs are now outperforming dedicated medical AI products on physician-reviewed clinical tasks. The authors compared OpenEvidence and UpToDate Expert AI with GPT-5.2, Gemini 3