增加查找步骤使AI在分配医疗诊断代码方面表现更佳Adding a lookup step makes AI better at assigning medical diagnosis codes

环球医讯 / AI与医疗健康来源:medicalxpress.com美国 - 英文2025-09-26 02:19:11 - 阅读时长4分钟 - 1540字
西奈山医疗系统研究人员发现,通过在人工智能分配医疗诊断代码前增加"查找"步骤,让AI能够参考类似历史案例,可显著提高编码准确性甚至超越医生表现。该方法能减少医生文书工作时间、降低计费错误并提升患者记录质量,已证实小型开源模型也能通过此方法获得优异效果,目前正整合至电子健康记录系统进行试点测试,旨在为临床医生提供智能支持而非替代,使医疗专业人员有更多时间专注于直接患者护理,从而提升整体医疗服务质量。
医疗诊断代码AI患者记录质量先查找后编码急诊患者电子健康记录临床护理计费错误人工监督患者健康
增加查找步骤使AI在分配医疗诊断代码方面表现更佳

西奈山医疗系统研究人员的一项新研究表明,对人工智能(AI)分配诊断代码的方式进行简单调整可显著提高准确性,甚至超过医生的表现。这项发表在《新英格兰医学杂志AI》上的研究结果可能有助于减少医生处理文书工作的时间、降低计费错误并提高患者记录的质量。

"我们之前的研究表明,即使是最先进的AI在自由猜测时也可能产生错误的代码,有时甚至是无意义的代码,"西奈山伊坎医学院Windreich人工智能与人类健康系生成式AI负责人Eyal Klang医学博士说道。"这次,我们让模型有机会反思并审查类似的过往案例。这一小改变带来了巨大不同。"

美国医生每周花费数小时分配ICD代码——这些字母数字组合用于描述从脚踝扭伤到心脏病发作等一切情况。但像ChatGPT这样的大型语言模型在正确分配这些代码时常常遇到困难。为解决这个问题,研究人员尝试了一种"先查找后编码"的方法,首先提示AI用通俗语言描述诊断,然后从真实世界示例列表中选择最合适的代码。这种方法提供了更高的准确性、更少的错误,以及与人类相当甚至更优的表现。

研究团队利用了西奈山医疗系统医院的500次急诊患者就诊记录。对于每个案例,他们将医生的记录输入到九种不同的AI模型中,包括小型开源系统。首先,这些模型生成初始ICD诊断描述。使用检索方法,每个描述与来自超过100万条医院记录数据库中的10个类似ICD描述相匹配,并附有这些诊断发生的频率。在第二步中,模型使用这些检索到的信息选择最准确的ICD描述和代码。急诊医生和两个独立的AI系统独立评估了编码结果,且不知道这些代码是由AI还是临床医生生成的。

总体而言,使用检索步骤的模型表现优于未使用的模型,甚至在许多情况下比医生分配的代码表现更好。令人惊讶的是,即使是小型开源模型在允许"查找"示例时也表现出色。

"这是关于更智能的支持,而不是为了自动化而自动化,"西奈山伊坎医学院Windreich人工智能与人类健康系主任、Hasso Plattner数字健康研究所主任、Irene和Arthur M. Fishberg医学教授,以及西奈山医疗系统首席AI官Girish N. Nadkarni医学博士兼公共卫生硕士说道。"如果我们能减少医生在编码上花费的时间、降低计费错误并提高数据质量,且使用一个经济实惠且透明的系统,这对患者和医疗服务提供者来说都是一大胜利。"

作者强调,这种增强检索的方法旨在支持而非取代人工监督。虽然它尚未获得计费批准,并且专门针对从急诊回家的患者的主要诊断代码进行了测试,但它在临床使用方面显示出令人鼓舞的潜力。研究人员认为可以立即应用,例如在电子记录中建议代码或在计费前标记错误。

研究人员目前正在将该方法整合到西奈山的电子健康记录系统中进行试点测试。他们希望将来能将其扩展到其他临床环境,并包含次要和程序性代码。

"这里的宏观图景是AI改变我们护理患者方式的潜力。当技术减轻我们医生和其他医疗服务提供者的行政负担时,他们就有更多时间直接照顾患者。这对临床医生有利,对患者有利,对各种规模的医疗系统都有利,"西奈山医疗系统首席临床官兼西奈山医院院长David L. Reich医学博士说道。"以这种方式使用AI通过花更多时间与患者相处,提高了我们提供专注和富有同情心的护理的能力。这加强了各地医院和医疗系统的基础。"

更多信息:《评估用于医疗编码的检索增强型大型语言模型》,《新英格兰医学杂志AI》(2025)。DOI: 10.1056/AIcs2401161

由西奈山医院提供

【全文结束】

大健康
大健康