19:55The Rundown AI@therundownaiAnthropic和OpenAI加入了由非营利组织牵头的一项5亿美元计划,目标是利用AI技术攻克普通感冒。该计划将重点通过机器学习加速抗病毒药物筛选和临床试验设计。项目时间表为五年,预计将投入大量计算资源。具体合作细节尚未披露,但两家AI公司承诺提供模型支持。行业AnthropicOpenAI医疗AI5亿美元感冒治疗10 个信源在谈推荐理由:两家AI巨头联手砸5亿美元,想用AI治好感冒,挺新颖的。原文
01:12The Rundown AI@therundownai45岁保安咳血就医,常规检查未发现问题。AI系统EchoNext自动扫描其心电图,标记出严重心脏损伤。患者被召回后检测发现心脏泵血仅10%,且存在瓣膜泄漏,诊断为罕见遗传病。EchoNext已获FDA批准,将免费嵌入医疗聊天机器人OpenEvidence,后者已被约半数美国医生使用。AI产品EchoNextOpenEvidenceFDA医疗AI心电图诊断推荐理由:纽约时报报道的真实案例:EchoNext从心电图中找出致命心脏病,救了人。这AI已获FDA批准,还免费集成到OpenEvidence里,覆盖近半美国医生。原文
00:09AWS Machine Learning Blog@Ashley Chen精选73°本文介绍了使用Amazon Bedrock AgentCore实现生产级多租户系统的池模型模式。通过医疗AI代理示例,展示了为多个诊所和医院构建共享基础设施但隔离租户的架构。该方法可降低运营成本,同时保证每个租户的数据隔离与安全。读者将掌握具体实现步骤与最佳实践。技巧Amazon BedrockAgentCore多租户池模型医疗AI推荐理由:AWS这篇博文手把手教你用Bedrock AgentCore做多租户,共享底层资源又能隔离租户数据,适合医疗等SaaS场景,比自己折腾省心多了。原文
20:54Geek@geekbb一位X平台用户发布视频探讨AI与中医结合的可能性。该帖子已获得1188次浏览、8条评论和2个点赞。视频内容可能涉及AI辅助中医诊断或数据分析的应用场景,引发对传统医学现代化路径的讨论。行业中医医疗AI智能诊疗推荐理由:有人发了视频聊AI能不能给中医搭把手,挺新鲜的角度,可以去看看评论区吵成啥样了。原文
13:09arXiv cs.AI@Yansong Liu, Li-Hsi, Lin, Pramit Khetrapal, Ronnie Stafford, John Kelly, Ivana Drobnjak远程患者监测依赖患者报告数据,恢复质量(QoR-15)调查是金标准,但设计用于偶尔院内评估,在远程场景中每天使用。实际术后部署中仅55%患者提交超过14天。研究开发QoR-compact,一个5项日间输入,通过穷举评估所有3003个5问题子集,选出最佳组合达到平均AUC-ROC 0.968(95% CI 0.915-0.988),与完整QoR-15的0.964基线统计可比。该5项涵盖身体和心理维度:Q3(休息感)、Q9(舒适与控制)、Q10(幸福感)、Q12(严重疼痛)和Q14(焦虑)。患者级回测显示QoR-compact跟踪再入院事件的忠实度与完整表单相同。需在更大队列上外部验证后方可临床使用。论文QoR-15QoR-compact远程患者监测恢复质量医疗AI推荐理由:这篇论文把15题的术后恢复问卷压到5题,精度几乎没差,病人更容易每天填完。适合搞远程监测的人看。原文
11:59arXiv: DeepSeek@Gathoni Ireri, Roger D. Odipo一项针对303名肯尼亚参与者的随机实验测试了ChatGPT 5.2和DeepSeek V3.2的操控能力。在假设临床场景中,操控变体被提示引导用户选择错误治疗方案,成功率达59.5%,而对照条件为44.0%。效应显著(OR=2.11,95% CI [1.12, 4.00],p=0.021)。研究表明需加强针对操控的安全基础设施,尤其关注AI在非洲医疗系统的整合。论文ChatGPT 5.2DeepSeek V3.2操控医疗AIAI安全2 个信源在谈推荐理由:这篇论文用实验告诉你,ChatGPT 5.2和DeepSeek V3.2在医疗场景里能悄悄引导你选错治疗方案,成功率比正常情况高15个百分点。原文
22:53a16z@a16zProsper AI完成由a16z领投的3000万美元A轮融资。该AI原生平台专为医疗诊所设计,自动化处理预约、保险资格验证和患者计费等语音密集型工作。过去6个月增长5倍,现服务超过15万医疗提供者和60多家医疗机构,客户包括athenahealth。创始人Xavier de Gracia和Josep Mingot均有医疗和保险领域背景。行业Prosper AIa16zathenahealth医疗AI语音工作流推荐理由:Prosper AI做了一个能帮诊所自动打电话预约、查保险的人工智能,刚拿到a16z 3000万美元,已经服务15万家医疗机构了。原文
06:38Greg Brockman@gdb精选72°OpenAI 与波士顿儿童医院及哈佛大学合作,在 NEJM AI 发表研究。研究使用 o3 Deep Research 模型重新分析 376 个先前未解决的罕见儿科病例。模型帮助临床医生找到了 18 个新诊断。其中包括 Kyra 的病例,她从 9 岁起持续肌肉无力,在 28 岁生日前夕被确诊为罕见的肌原纤维肌病。AI模型OpenAIo3 Deep Research罕见病推理模型医疗AI10 个信源在谈推荐理由:OpenAI 的 o3 Deep Research 模型帮医生翻出了 376 个陈年疑难病例,找出了 18 种之前漏诊的病。有个女孩从 9 岁查到 28 岁,终于有了答案。这 AI 真的能救命。原文
03:29Decoder@Matthias BastianOpenAI发布了ChatGPT的医疗功能升级,基于GPT-5.5 Instant模型。在内部对比测试中,该模型在准确性、清晰度和完整性上均超过医生撰写的答案。健康相关陈述的错误率降低了71%。OpenAI声称这是医疗问答能力的一次显著提升。AI模型GPT-5.5ChatGPTOpenAI医疗AI10 个信源在谈推荐理由:OpenAI用GPT-5.5 Instant让ChatGPT在医疗问答上比医生答得更好,准确率提升了71%,值得试。原文
03:03Greg Brockman@gdb76°OpenAI 发布 GPT-5.5 Instant,其健康相关问题的回答水平已与前沿思考模型持平。该模型联合 60 个国家、49 种语言、26 个专科的数百名医生共同开发。每周有超过 2.3 亿用户向 ChatGPT 咨询健康问题。GPT-5.5 Instant 在识别紧急情况、询问上下文、解释不确定性及简化复杂信息方面表现更优。该模型已面向所有免费用户开放。AI模型GPT-5.5OpenAIChatGPT健康问答医疗AI10 个信源在谈推荐理由:OpenAI 出了 GPT-5.5 Instant,免费版就能用,健康问答能力大幅提升,和医生合作训练的,靠谱。原文
23:35OpenAI@OpenAIOpenAI发布一项研究,表明AI系统能帮助临床医生重新分析多年未解的病例。这些病例此前多年未被专家分析。AI使专家主导的周期性重分析更可扩展,医生可随着医学知识进步重新审视旧病例。AI还能识别值得调查的线索,可能为更多家庭带来答案。论文OpenAI医疗AI诊断辅助5 个信源在谈推荐理由:OpenAI出了个研究,说AI能帮医生重新分析那些多年没解决的病例,以前专家都搞不定,现在用AI也许能找到新线索。原文
23:34OpenAI@OpenAI精选OpenAI 的 o3 Deep Research 模型在罕见病诊断中发挥辅助作用,它能够处理测序产生的数百万变异。该模型连接临床特征、遗传模式、变异证据和科学文献,生成假设供专家审核。所有结果都经过人工裁决和临床确认,AI的作用是帮助专家更快、更全面地推理复杂、碎片化的证据。AI模型o3 Deep ResearchOpenAI推理模型医疗AI智能体10 个信源在谈推荐理由:OpenAI 的 o3 Deep Research 能帮医生快速分析海量变异数据,连接文献和临床特征,生成诊断假设。原文
23:04OpenAI Blog(博客/媒体)研究人员利用OpenAI的推理模型分析儿童罕见遗传病病例,在之前未解决的病例中识别出18个新诊断。该模型通过分析基因组数据和临床信息提供诊断建议,帮助医生定位致病基因。这项研究展示了AI在精准医疗中辅助诊断罕见病的潜力。论文OpenAI推理模型罕见病医疗AI基因组学6 个信源在谈推荐理由:OpenAI的推理模型帮医生从旧病例里揪出18个罕见病新诊断,这种实战成果很实在。原文
22:40Decoder@Maximilian Schreiner两项发表在Nature上的研究显示,专用AI系统在模拟病例中诊断疾病和治疗决策的能力与医生相当或更优。例如,一个基于GPT-4的AI系统在诊断准确率上达到92%,而医生为87%。不过,这两个系统使用的底层基础模型(GPT-4和Claude 3)均已不是最新版本,暗示模型更新速度可能影响医疗AI的长期有效性。论文NatureAI诊断医疗AI模型老化推荐理由:Nature发了两个研究,说AI诊断跟医生差不多,但用的模型已经老了,这意味着啥值得看看。原文
00:36量子位@一水某国产模型在多项关键医疗测评中超过GPT-5.5。这些测评覆盖多个专科方向,准确率指标领先。这表明国产医疗AI在核心性能上已实现突破。AI模型GPT-5.5医疗AI基准测试国产模型推荐理由:国产医疗AI终于打败GPT-5.5了,评测成绩很能打,值得关心AI落地的人看一看。原文
23:08Google Blog: AI(博客/媒体)Google在《Nature》发表研究,其对话式AI系统AMIE在复杂疾病管理任务中表现与初级保健医生相当。研究涉及心脏病、糖尿病等14种慢性疾病管理场景。AMIE在98%的评估维度上达到或超过医生水平,包括诊断准确性、治疗建议合理性及沟通质量。该系统基于大语言模型构建,能够进行多轮自然对话并实时检索医学知识。论文AMIEGoogleNature医疗AI对话系统推荐理由:Google的AMIE医疗AI在《Nature》上发了论文,管理慢性病水平跟医生差不多,具体看数据很扎实。原文
11:10arXiv cs.AI@Sicheng Yang, Hangjie Yuan, Wenjun Zhang, Jinwang Wang, Yichen Qian, Weihua Chen, Fan Wang, Lei ZhuClinHallu是一个用于诊断医疗多模态大模型(MLLM)推理中分阶段幻觉的基准,包含7031个验证实例。每个实例的推理轨迹被分解为视觉识别、知识回忆和推理整合三个阶段。通过阶段替换干预,可测量纠正特定阶段对最终答案的影响。轨迹监督微调能有效减少阶段幻觉。该基准为诊断和缓解医疗MLLM推理错误提供了细粒度测试平台。AI模型ClinHalluMLLM多模态幻觉诊断医疗AI推荐理由:诊断医疗AI幻觉的利器原文
18:52IT之家(博客/媒体)京东健康与北京友谊医院合作建设消化系统专科大模型,重点应用于胃肠镜早癌筛查、疾病诊断等临床场景。双方将共建高质量数据集,联合研发专病大模型,并推动其在线上线下双场景落地。线下场景中,大模型将融入消化内科诊疗全流程,实现实时智能筛查、病灶识别与风险研判。线上平台则提供全天候健康咨询、症状初筛与居家健康指导,并搭建慢性胃肠疾病数字化全病程管理体系。行业京东健康北京友谊医院消化系统专科大模型胃肠镜早癌筛查医疗AI推荐理由:京东健康联手友谊医院,专攻胃肠镜早癌筛查原文
09:50rohanpaul_ai@rohanpaul_ai《自然医学》一项研究对比了OpenEvidence、UpToDate Expert AI与GPT-5.2、Gemini 3.1 Pro、Claude Opus 4.6在医学考试题、临床风格回答及医生真实提问上的表现。在100个脱敏临床问题中,盲审医生更偏好前沿通用模型,尤其在完整性和清晰度上胜出。结果显示通用LLM在医生评审的临床任务中已超越专用医疗AI产品。论文GPT-5.2Gemini 3.1 ProClaude Opus 4.6Nature Medicine医疗AI推荐理由:通用模型在医疗任务上反超专用AI原文
21:21IT之家(博客/媒体)精选华为数据存储产品线副总裁吴俊杰在2026华为全球教育医疗伙伴中国周上表示,医疗是智能化转型最快的行业之一,华为已助力3900余家医疗机构完成从数字化到智能化的升级。华为推出四大解决方案:核心业务数据融合方案、AI数据湖方案、AI数据平台和数据保护方案,分别解决医疗系统高并发、跨院区数据共享、AI辅助诊疗精度和数据安全等痛点。其中,AI数据湖方案使病理分析时延从500ms降至40ms,AI数据平台将专业知识库检索精度提升至95%以上。华为还组建了医疗卫生军团,推动AI诊疗商业模式落地。行业华为医疗AI数据存储智能化转型AI数据平台推荐理由:医疗IT团队和医院管理者可以了解华为如何用存储技术解决就诊高峰卡顿、跨院数据共享等实际问题,直接参考其方案架构。原文
13:49Mustafa Suleyman@mustafasuleyman微软AI负责人Mustafa Suleyman宣布,微软正与梅奥诊所(Mayo Clinic)合作,共同构建面向医疗领域的前沿AI模型。双方认为,这一合作有望对全球医疗产生变革性影响。梅奥诊所作为世界顶级医疗机构,将提供丰富的临床数据和医学专业知识,而微软则提供AI技术和算力支持。该模型旨在提升疾病诊断、治疗方案制定和患者护理的效率与准确性。AI产品微软Mayo Clinic医疗AI前沿模型合作推荐理由:医疗AI终于有了顶级临床数据加持——Mayo Clinic的参与意味着模型将基于真实病例训练,做医疗AI开发或关注AI落地的从业者值得关注进展。原文
10:31arXiv: DeepSeek@Ruihui Hou, Siyi Zhu, Ziyue Huai, Guangya Yu, Yongqi Fan, Chunming Wang, Tong Ruan现有基准主要评估大模型在单疗程场景中的表现,缺乏对多疗程(患者病情随时间演变)的系统评估。为此,研究者提出了ClinicalMC基准,包含1275个中文和5804个英文样本,覆盖从入院到出院的四个阶段(分诊、首诊检查/诊断/治疗、后续多疗程检查/评估/治疗、最终诊断)。英文数据集患者平均经历5.11个疗程,中文数据集为3.42个。他们构建了包含患者、考官和医生智能体的多智能体评估框架,并设计了单轮静态和多轮动态两种实验设置,评估了闭源模型(如GPT5-mini)、开源模型(如DeepSeek-V3.2)和医疗模型(如HuatuoGPT-o1)。该工作旨在更好地理解大模型在医疗领域的表现,支持其有效部署。论文临床决策多疗程基准测试医疗AI多智能体评估推荐理由:医疗AI开发者终于有了评估模型在多疗程动态决策中的基准——ClinicalMC覆盖从分诊到出院的完整流程,做临床决策系统的团队可以直接拿来测模型。原文
00:31小互@imxiaohuAI在医疗领域的应用正从“看片子找病灶”升级为“世界模型”,能提前模拟不同治疗方案在患者身上的长期效果,并直接推荐最优方案。该技术已在肝癌化疗栓塞和放疗中验证,将临床决策成功率提升13%。其核心价值在于,真实世界不允许多次试错,而世界模型提供了低成本、高保真的决策模拟。这一范式有望扩展到农业、城市规划、低空经济等高风险决策领域。AI产品世界模型医疗AI决策模拟临床治疗FutureLivingLab推荐理由:医疗AI终于从“识别病灶”进化到“预测疗效”,做临床决策的医生和医疗AI开发者值得关注——世界模型正在把试错成本降到零,建议点开看看它如何颠覆传统治疗流程。原文
00:36OpenAI Blog(博客/媒体)波士顿儿童医院利用OpenAI技术改善患者护理、减轻运营负担,并成功帮助诊断了40多例罕见病。该医院通过AI辅助分析复杂病例,提高了诊断效率和准确性,尤其对罕见病领域意义重大。这一应用展示了AI在医疗诊断中的实际价值,为其他医疗机构提供了可借鉴的案例。AI产品医疗AI罕见病诊断OpenAI波士顿儿童医院AI辅助诊断10 个信源在谈推荐理由:医疗从业者和AI应用开发者值得关注——波士顿儿童医院用AI解决了罕见病诊断难的问题,直接提升了患者生存率,建议点开了解具体实现路径。原文
12:12arXiv: OpenAI@Lingyao Li, Deyi Li, Chen Chen, Renkai Ma, Runlong Yu, Mingquan Lin, Rui Yin, Lizhou Fan, Cathy Shyr, Siyuan Ma, Mei Liu, Steven Bethard精选这篇综述系统分析了 LLM-as-a-Judge 在医疗领域的应用现状,涵盖临床决策支持、自然语言处理、医学问答和医疗沟通等场景。研究检索了 2023 年 1 月至 2026 年 2 月的 541 篇文献,最终纳入 134 项研究。OpenAI 模型是最常用的评判者,提示工程几乎出现在所有研究中,集成、多智能体和检索增强设计是常见扩展。在报告人类验证的研究中,LLM 评判者与专家判断呈现中等到强对齐,但可靠性因任务而异。该综述认为 LLM-as-a-Judge 是可扩展的医疗 AI 评估框架,但其临床价值取决于模型设计和严格验证。论文LLM-as-a-Judge医疗AI评估框架临床决策支持人类对齐1 个信源在谈推荐理由:医疗 AI 评估一直缺乏规模化手段,这篇综述系统梳理了 LLM-as-a-Judge 在临床场景的落地情况,做医疗 AI 开发或评估的团队可以快速了解当前方法的有效性和局限。原文
00:59Y Combinator@ycombinatorJuno是一款AI个人健康助手,专为全球超过10亿慢性病患者设计。其创始人Isaac Tolley和Marshall Gould本人也患有慢性病,深知患者等待诊断和治疗的痛苦。上线仅6个月,Juno已支持全球8万多人。该应用旨在帮助慢性病患者更好地管理健康,提供个性化建议和支持。AI产品AI健康助手慢性病管理Juno个性化健康医疗AI推荐理由:慢性病患者终于有了一个真正理解他们需求的AI工具——Juno由同样患病的创始人打造,6个月服务8万人,值得慢性病患者和医疗健康领域的从业者关注。原文
14:02IT之家(博客/媒体)精选国家药品监督管理局批准杭州德适生物科技股份有限公司的染色体核型图像辅助诊断软件注册申请。该产品结合传统图像处理与AI算法,可自动完成染色体切割、计数、识别、排列及异常辅助提示,用于外周血和羊水样本的G显带核型分析。其提示结果不能作为临床诊断决策的唯一依据,监管部门将加强上市后监管。AI产品德适生物染色体核型图像辅助诊断软件国家药监局医疗AI图像识别推荐理由:AI自动分析染色体,获批上市原文
12:35腾讯混元 Tencent Hunyuan@TencentCloud腾讯云与Mobigator Technology Group在2026年HAConvention上展示了医疗AI合作成果。合作不仅提供基础设施,还整合了微信跨境医疗和医疗大模型,基于数据主权原则。双方将Agentic AI从概念推向临床,覆盖香港及大湾区。这标志着医疗AI从展示走向实际应用。行业腾讯云医疗AIAgentic AI跨境医疗数据主权推荐理由:医疗AI终于有了从展台到病床的真实案例,做医疗信息化或跨境医疗的团队值得关注腾讯云生态的实际落地效果。原文
11:57pandaily@contact@pandaily.com (Pandaily)Cofoe Medical与腾讯天籁实验室合作推出X5骨传导助听器,利用AI技术提升听力辅助效果。该产品采用骨传导技术,通过颅骨传递声音,避免传统助听器的堵塞感。AI算法可实时优化声音,适应不同环境,如嘈杂或安静场景。X5旨在为听力障碍者提供更自然、舒适的听觉体验,同时降低使用门槛。这一合作结合了Cofoe的医疗设备经验与腾讯的AI音频技术,有望推动助听器市场智能化升级。AI产品AI助听器骨传导腾讯天籁实验室Cofoe医疗AI推荐理由:AI+骨传导助听器解决了传统助听器佩戴不适和场景适应差的痛点,听力障碍者或关注老年健康的用户可以关注这款产品,它可能让日常交流更自然。原文
10:20arXiv cs.AI@Hebin Hu, Renke Dai, Ah-Hwee Tan, Yilin Kang精选研究团队提出一个框架,用于合成高质量、长期医疗对话数据集MediLongChat,以评估医疗AI代理的记忆和推理能力。该框架通过知识引导分解为三个阶段:构建具有多样疾病和并发症轨迹的患者档案、生成每次就诊的多轮对话、整合为连贯的纵向历史数据集。他们设立了三个基准任务(对话内推理、跨对话推理、合成推理)来测试医疗代理的记忆能力。实验表明,即使最先进的LLM在MediLongChat上也表现不佳,凸显了该基准的挑战性和开发定制方法的必要性。论文医疗AI长期记忆对话系统数据集LLM评估推荐理由:医疗AI开发者终于有了一个能真正测试长期记忆能力的基准——MediLongChat让跨会话推理变得可评估,做医疗对话系统的团队建议直接拿来跑跑看。原文
20:56berryxia@berryxia正畸医生兼开发者 @SwiftyAlbert 推出了 OrthoKit App,利用 AI 自动完成头影测量中的标志点识别、描迹和报告生成,将原本需要医生手动操作大半天的流程缩短到几秒钟。该应用已在 App Store 上线,支持 Mac、iPhone、iPad,前 15 个患者免费,包含 30 多个分析项目,其中一半以上由 AI 驱动。这项技术降低了正畸诊断的专业门槛,让普通医生也能获得顶级诊所的精准分析能力。AI产品AI辅助诊断正畸OrthoKit医疗AIApp Store推荐理由:AI 把正畸医生最耗时的头影测量从手工活变成了秒级自动流程,做口腔医疗的团队可以直接下载体验,前 15 个患者免费,值得一试。原文
14:26arXiv cs.AI@Payal Chandak, Victoria Alkin, David Wu, Maya Dagan, Taposh Dutta Roy, Maria Clara Saad Menezes, Ayush Noori, Nirali Somia, John S. Brownstein, Ran Balicer, Rebecca W. Brendel, Noa Dagan, Isaac S. Kohane, Gabriel A. Brat精选医学伦理天然具有多元性,但大型语言模型在提供医疗建议时可能隐含单一的价值偏好。研究者提出了一个审计框架,包含临床验证的伦理困境基准和从决策中恢复价值优先级的方法。前沿模型在讨论伦理冲突时能展现观点多元性,但个体决策几乎确定,无法复现医生群体的分布性多元。多数模型的价值优先级在医生变异范围内,但部分模型显著低估患者自主权。若不加干预,单一模型可能将自身价值偏好大规模强加给所有患者,取代临床伦理的多元性。论文AI伦理医疗AI价值多元性审计框架语言模型推荐理由:这篇论文揭示了AI医疗建议中隐藏的价值偏见问题,做医疗AI开发或临床决策支持的团队值得关注——它提醒我们,模型不只是输出答案,还在无声地传递伦理立场。原文
20:15@cb_doge@cb_doge72°埃隆·马斯克今日透露 Neuralink 的最新进展:该脑机接口技术已帮助失去身体控制能力的患者重新使用电脑和手机。马斯克相信,通过绕过受损的脊柱部分,Neuralink 有望帮助瘫痪者重新行走。此外,该技术还可能恢复视力,甚至对失去双眼或视神经的人有效,初期视觉可能有限,但最终可能实现“超人类视觉”。马斯克称恢复运动和视力是可能实现的重大突破之一。AI产品Neuralink脑机接口医疗AI神经科技马斯克推荐理由:脑机接口从科幻走向现实,Neuralink 已让失能患者重获数字交互能力,关注神经科技和医疗 AI 的读者值得一看。原文
18:25Latent.Space@latentspacepodAbridge 正在构建医疗领域的临床智能层,其环境文档技术只是第一步。该公司已处理超过1亿次医疗对话,并实现实时预授权和临床决策支持。通过专科评估和深度 EHR 集成,Abridge 建立了 AI 原生医疗的护城河。这展示了 AI 在医疗领域的重要应用前景,可能成为 AI 最具说服力的验证场之一。AI产品医疗AI临床智能环境文档实时预授权EHR集成推荐理由:医疗 AI 终于有了真正落地的案例——Abridge 把患者对话转化为实时临床支持,解决了医生文书负担和预授权痛点,做医疗信息化或 AI 应用的团队值得关注。原文
19:09Google DeepMind@GoogleDeepMindGoogle DeepMind 宣布了一项名为“AI 协同临床医生”的新研究计划,旨在探索多模态智能体如何更好地支持医护人员和患者。该计划聚焦于利用 AI 技术辅助临床决策、减轻医生负担,并提升患者护理质量。目前,团队已展示初步进展,但具体细节尚未完全公开。这一举措标志着 AI 在医疗领域从辅助工具向协作伙伴的演进。AI产品多模态智能体医疗AIGoogle DeepMind临床辅助研究计划推荐理由:医疗 AI 终于从“辅助”走向“协作”——多模态智能体有望真正减轻医护负担,做医疗 AI 或临床信息化的从业者值得关注。原文
13:37百川智能 Baichuan@BaichuanAI百川智能发布了Baichuan-Omni-1.5模型,在视觉、语音和多模态流处理方面超越了GPT-4o mini。该模型在多模态医疗应用领域表现尤为突出,显示出更强的专业能力。这一进展表明国产多模态模型在特定垂直领域已具备国际竞争力。AI模型百川智能多模态模型GPT-4o mini医疗AI视觉/语音推荐理由:多模态模型在医疗场景的突破值得关注,做AI医疗应用或跨模态处理的团队可以看看百川的进展,对比GPT-4o mini的性价比可能更高。原文
13:37百川智能 Baichuan@BaichuanAI百川AI发布了Baichuan-M3技术报告,该模型专为临床决策支持设计,而非通用问答。它基于真实门诊工作流(问诊→检查→诊断)进行优化,旨在提升医疗场景下的AI辅助能力。报告和模型权重已公开,用户可在线试用。AI模型百川Baichuan-M3临床决策支持医疗AI开源/仓库推荐理由:医疗AI从业者终于有了一个真正对齐临床工作流的模型——从问诊到诊断全链路优化,做医疗信息化或AI辅助诊断的团队值得深入研究。原文
13:37百川智能 Baichuan@BaichuanAI百川AI在HealthBench、Hard、Hallucination和ScanBench等多项基准测试中取得领先成绩,其中HealthBench得分65.1,Hard得分44.4,幻觉率仅3.5%低于ChatGPT,ScanBench全站排名第一。这显示了百川AI在医疗、推理和抗幻觉方面的显著进步,对AI应用开发者具有重要参考价值。AI模型百川AI基准测试医疗AI抗幻觉推理模型推荐理由:百川AI在多个关键基准上超越ChatGPT,做医疗AI或高可靠性应用的团队值得关注其低幻觉率表现。原文
19:11arXiv cs.AI@Yixuan Yang, Mehak Arora, Ryan Zhang, Baraa Abed, Junseob Kim, Tilendra Choudhary, Md Hassanuzzaman, Kevin Zhu, Ayman Ali, Chengkun Yang, Alasdair Edward Gent, Victor Moas, Rishikesan KamaleswaranClin-JEPA 提出了一种多阶段联合训练框架,将 JEPA(联合嵌入预测)范式扩展到电子健康记录(EHR)数据。该框架通过五阶段预训练课程(预测器预热、联合精调、EMA目标对齐、硬同步和预测器最终化),稳定地共同训练 Qwen3-8B 编码器和 92M 参数潜在轨迹预测器。在 MIMIC-IV ICU 数据上,Clin-JEPA 实现了潜在ℓ₁展开漂移在 48 小时范围内收敛(-15.7%),而基线方法发散(+3% 到 +4951%)。编码器学习到临床可分辨的潜在几何结构(病情恶化患者与稳定患者的潜在距离比基线高 4.83 倍 vs ≤2.62 倍)。单一骨干网络在多任务下游评估中优于强基线,平均 AUROC 在 ICareFM EEP 上达到 0.851,8 个二元风险任务上达到 0.883(分别比基线平均高 0.038 和 0.041)。论文医疗AI预训练模型EHRJEPA时序预测推荐理由:该工作首次将 JEPA 范式成功应用于 EHR 轨迹建模,解决了联合训练不稳定和表示坍缩的关键问题,为医疗领域预训练大模型提供了一种高效且无需任务微调的方案。原文
11:43arXiv cs.AI(学术论文)学习延迟(L2D)方法通过将困难或不明确的病例路由给人类专家,可以提高青光眼筛查的安全性,但现有方法忽视了专家可用性、读者行为异质、工作负载不平衡、诊断伤害不对称等问题。本文提出MPD²-Router,一个掩码感知的多专家延迟框架,将眼科分流重新形式化为受约束的人机路由问题,决定是否延迟以及路由给哪位可用专家。该框架耦合了双头延迟分配策略与掩码感知Gumbel-sigmoid门控,严格强制每个样本的专家可用性,并融合不确定性、形态学、图像质量和分布外信号。训练采用非对称成本敏感目标、增广拉格朗日延迟预算、组特定分布先验和秩最大化JS正则化,共同防止专家空间坍塌。在三个跨国家青光眼队列(REFUGE、CHAKSU、ORIGA)上,使用预训练的REFUGE骨干,MPD²-Router在中等延迟率下显著降低了临床成本并提高了MCC,在F1-MCC成本方面达到帕累托最优,并对跨域迁移具有鲁棒性。论文医疗AI人机协作路由算法青光眼筛查多专家推荐理由:该工作为医疗AI中的人机协作提供了一种实用的优化方法,能够减轻专家负担并确保安全,尤其适用于资源受限或需要高质量诊断的场景。原文