具备详细诊断推理能力的人工智能系统展示其实力An AI System With Detailed Diagnostic Reasoning Makes Its Case | Harvard Medical School

环球医讯 / AI与医疗健康来源:hms.harvard.edu美国 - 英语2025-10-15 01:47:53 - 阅读时长7分钟 - 3249字
哈佛医学院研究人员开发了一种名为"Dr. CaBot"的人工智能系统,该系统能够在处理复杂医疗案例并得出诊断时详细阐述其推理过程。这是《新英格兰医学杂志》首次同时发布由人工智能生成的诊断和人类临床医生的诊断。该系统在医学教育和研究领域展现出巨大潜力,其独特之处在于能够解释详细、细致的推理过程而不仅仅是提供最终答案,为医学生和教育者提供全新学习工具,同时暗示了未来临床应用的可能性,尽管目前仍需进一步改进和完善才能进入实际医疗环境,标志着人工智能在医学诊断领域迈出了重要一步。
人工智能系统Dr.CaBot医学诊断医学教育临床研究医疗案例健康诊断医学推理患者诊断人机协作
具备详细诊断推理能力的人工智能系统展示其实力

凯瑟琳·卡鲁索(Catherine Caruso) 2025年10月8日 研究 5分钟阅读

图片来源:Getty Images/gremlin

要点速览:

  • 研究人员开发了一种名为Dr. CaBot的人工智能系统,该系统在处理复杂医疗案例并得出诊断时能够详细阐述其推理过程。
  • 《新英格兰医学杂志》首次在同一医学案例研究系列中同时发布了由Dr. CaBot生成的人工智能诊断和人类临床医生的诊断。
  • 该工具在医学教育和研究方面具有潜在应用价值。

除了一个关键方面外,这一设置在医学领域颇为熟悉:一位专家诊断医生向满屋子的同事展示一个特别具有挑战性的病例,仔细引导他们了解患者的症状和初步检查结果。这位医生借助幻灯片,详细解释她在分析病例和考虑每种可能性时的推理过程。在五分钟的演讲结束时,她揭示了诊断结果以及她会建议的下一步措施。

这次的转折点?这次的诊断医生是一个名为Dr. CaBot的人工智能系统。

哈佛医学院的研究人员正在将Dr. CaBot开发为一种医学教育工具。该系统以演示和书面两种形式运作,展示其如何推理病例,提供所谓的鉴别诊断——即解释病情的可能状况的全面列表——并逐步缩小可能性范围,直至得出最终诊断。

Dr. CaBot能够阐述其"思维过程",而不仅仅是专注于得出准确答案,这使其与其他人工智能诊断工具有所不同。它也是少数几个专为处理更复杂医疗案例而设计的模型之一。

"我们希望创建一个能够生成鉴别诊断并以专家诊断医生的水平解释其详细、细致推理的人工智能系统,"哈佛医学院Blavatnik研究所生物医学信息学助理教授阿俊(拉吉)·曼赖(Arjun (Raj) Manrai)表示。曼赖与哈佛肯尼思·格里芬文理学院博士生、曼赖实验室成员托马斯·巴克利(Thomas Buckley)共同创建了Dr. CaBot。

尽管该系统尚未准备好用于临床,曼赖及其团队一直在波士顿地区医院进行Dr. CaBot的演示。现在,Dr. CaBot有机会在《新英格兰医学杂志》著名的马萨诸塞州总医院病例记录(也称为临床病理学会议,或CPCs)中与专家诊断医生一较高下。这标志着该杂志首次发布人工智能生成的诊断。

10月8日发表在《新英格兰医学杂志》上的这一医学病例讨论,展示了Dr. CaBot的能力,突显了其对医学教育者和学生的用处——并暗示了其在临床中对医生的潜在价值。随着研究人员继续改进Dr. CaBot,他们希望它将成为全球其他医学人工智能团队的有用模型。

百年医学病例

CPC的概念可以追溯到19世纪末,当时马萨诸塞州总医院的医生开始将患者病例研究用于医学教育。1900年,马萨诸塞州总医院病理学家理查德·卡博特(Richard Cabot)——Dr. CaBot以其命名——将这些病例纳入哈佛医学院培训医生的课程。自1923年以来,《新英格兰医学杂志》一直在连续发布这些病例作为CPC,教导医生如何通过复杂病例进行推理。

"这些病例相当传奇。它们以极具挑战性著称,充满干扰和误导性线索,"曼赖说。

每个CPC都包括患者医生对病例的详细陈述。然后,邀请一位未参与该病例的专家向马萨诸塞州总医院的同事们进行演示,逐步解释他们的推理过程,并在确定最可能的诊断前提供鉴别诊断。之后,患者的医生揭示实际诊断结果。诊断医生的书面分析与病例陈述一起发表在《新英格兰医学杂志》上。

10月8日《新英格兰医学杂志》的文章包括一个典型的病例陈述,以及来自旧金山退伍军人事务医疗中心和加州大学旧金山分校的专家诊断医生古普里特·达利亚瓦尔(Gurpreet Dhaliwal)的精心推理的鉴别诊断。曼赖将达利亚瓦尔描述为"真正的现代版豪斯医生"。之后,是Dr. CaBot的鉴别诊断。

曼赖和巴克利欣喜地发现,尽管Dr. CaBot与达利亚瓦尔的病例推理方式不同,但它得出了相当的最终诊断。

从Dr. Cabot到Dr. CaBot

在研究生院期间,曼赖对CPC如何揭示医生得出诊断的过程产生了浓厚兴趣。这些病例让他想起了他成长过程中喜欢的推理小说。

最近,他的实验室和其他研究团队研究了人工智能模型提供患者诊断的准确性。曼赖想知道是否有可能设计一个能走得更远的系统。

Dr. CaBot的核心是OpenAI的o3大型语言推理模型。在构建该系统时,作为哈佛医学院"医学人工智能"项目的邓利维研究员(Dunleavy Fellow),巴克利需要为o3增加新能力。

其中之一是Dr. CaBot能够高效搜索来自高影响力期刊的数百万临床摘要,这有助于其正确引用工作并避免事实性幻觉。Dr. CaBot还可以搜索其包含数千个CPC的"大脑",并利用这些示例复制《新英格兰医学杂志》中专家诊断医生的风格。该团队正与贝斯以色列女执事医疗中心和其他哈佛附属医院的临床医生合作者密切合作,继续改进该系统。

Dr. CaBot提供两种主要产品。

第一种是大约五分钟的、有旁白的、基于幻灯片的病例演示,系统在其中解释它如何通过各种可能性推理得出诊断。巴克利表示,这些演示"出人意料地逼真",包括"呃"、"嗯"和"你知道"等填充词以及口语化短语。

在团队的演示中,"旁白演示的真实性似乎与医生们产生了共鸣,"曼赖说。

另一种是Dr. CaBot推理和诊断的详细书面版本。

将Dr. CaBot推向更广范围

研究人员渴望医生们与Dr. CaBot互动并提供专家反馈。为此,他们计划在本地医院进行更多演示,并在预印本服务器上发表了一篇描述该系统的论文。他们将《新英格兰医学杂志》CPC视为另一个获取反馈的机会。

CPC上的编辑说明写道:"Dr. CaBot的人工智能生成讨论尚未经过正确性分析;存在的任何事实错误均予以保留,以便读者观察系统的优点和局限性,"并总结道:"人工智能在临床决策中是否具有合法用途,由读者自行判断。"

Dr. CaBot制作的一个具有挑战性的医疗病例的旁白视频演示。视频:曼赖实验室 Dr. CaBot也可供用户测试新病例用于教育和研究目的,并查看15个现有病例的演示和书面分析,从"一名患有皮肤病变的女婴"到"一名进行性呼吸困难的89岁男性"。

"我们真的在冒险,"曼赖说。"有很大的尴尬风险,但通过给真正的临床医生播放五分钟的视频,你可以学到很多。我们通过这种方式获得了大量反馈。"

尽管Dr. CaBot的主要用途是作为教育工具,但其快速筛选数百万临床摘要的能力也可能使其成为有价值的研究辅助工具。

据曼赖和巴克利称,在考虑将其应用于实际环境之前,该工具需要进一步改进、验证,并增加患者隐私保护。然而,该团队指出,医生们已经表现出兴趣。

他们表示,人工智能系统的优势在于它始终可用、不会疲倦、不会分心处理其他职责,并能快速搜索大量医学文献。

曼赖补充说,有证据表明医生们使用人工智能工具的量"我认为会令许多人惊讶",包括ChatGPT和一个名为OpenEvidence的面向医生的平台。

"我们在人机协作方面还处于初级阶段,"曼赖说,但该领域正在快速发展。最终,Dr. CaBot可能会加入医生们已经在探索的人工智能工具箱,帮助他们确定如何最好地帮助患者。

作者信息、资金来源和披露

《新英格兰医学杂志》CPC的其他作者包括迈克尔·胡德(Michael Hood)、阿克维·阿松邦(Akwi Asombang)和伊丽莎白·霍曼(Elizabeth Hohmann)。

作者提供的披露表格随文章全文提供。

【全文结束】

大健康
大健康