每年有数百万美国人接受手术。手术后,预防肺炎、血栓和感染等并发症可能是成功恢复与长时间痛苦住院之间的关键区别——甚至更糟。超过10%的手术患者会经历这些并发症,这可能导致重症监护病房(ICU)停留时间延长、死亡率升高和医疗费用增加。早期识别高风险患者至关重要,但准确预测这些风险仍然是一项挑战。
最近的人工智能(AI)进展,特别是大型语言模型(LLM),提供了一个有希望的解决方案。这项由陈阳卢教授领导的研究探讨了LLM通过分析术前评估和临床笔记来预测术后并发症的潜力。陈阳卢是华盛顿大学圣路易斯分校麦凯尔维工程学院计算机科学与工程系的富尔格拉夫教授,也是该校健康研究所(AIHealth)的主任。
该研究发表在《npj数字医学》杂志上,表明专门训练的LLM在预测术后风险方面显著优于传统的机器学习方法。
“手术带有重大风险和成本,但临床笔记中包含了外科团队的宝贵见解,”卢教授说。“我们专门针对手术笔记设计的大型语言模型能够早期且准确地预测术后并发症。通过主动识别风险,临床医生可以尽早干预,从而提高患者的安全性和治疗效果。”
传统的风险预测模型主要依赖于结构化数据,如实验室检测结果、患者人口统计信息以及手术细节(如手术时长或外科医生的经验)。虽然这些信息无疑是有价值的,但它往往缺乏患者独特临床叙述中的细微差别,而这些叙述在详细的临床笔记中得到了体现。这些笔记包含患者的个人病史、当前状况以及其他影响并发症可能性的因素。
卢教授及其合著者查尔斯·阿尔巴和薛冰(两位当时在卢教授指导下工作的研究生)使用公开可用的医学文献和电子健康记录训练了专门的LLM。然后,他们对预训练模型进行了微调,使其更好地预测手术结果。由此产生的方法——这是首次处理手术笔记并利用它们来预测术后结果的方法——能够超越结构化数据,识别出可能被忽视的患者状况模式。
基于2018年至2021年间从美国中西部一家学术医疗中心收集的近85,000份手术笔记和相关患者结果,研究团队报告称,他们的模型在预测并发症方面的表现远胜于传统方法。对于每100名经历术后并发症的患者,新模型比传统的自然语言处理模型多正确预测了39名有并发症的患者。
除了能及早发现并减轻潜在的手术并发症患者数量外,该研究还展示了基础AI模型的强大功能,这些模型旨在执行多种任务,并可应用于广泛的问题。
“基础模型可以多样化,因此通常比专门模型更有用。在这种情况下,由于许多并发症都可能发生,模型需要足够灵活以预测许多不同的结果,”阿尔巴说,他还是华盛顿大学计算与数据科学部的研究生。
“我们同时对多个任务进行了微调,并发现它比专门为检测个别并发症而训练的模型更准确地预测并发症。这是合理的,因为并发症通常是相关的,所以统一的基础模型可以从不同结果的共享知识中受益,而不必为每个结果进行繁琐的调整。”
“这种多功能模型有可能在各种临床环境中部署,以预测广泛的并发症,”华盛顿大学医学院麻醉学副教授兼医学信息学研究所(I2)成员乔安娜·亚伯拉罕说。“通过早期识别风险,它可能成为临床医生不可或缺的工具,使他们能够采取主动措施并定制干预措施,以改善患者的结果。”
(全文结束)


