最近,关于人工智能(AI)的讨论非常热烈,人们纷纷声称“AI将取代医生”、“AI可以完美理解所有临床文本”、“大型语言模型(LLMs)可以像医生一样诊断疾病”,以及“LLMs将立即消除所有行政任务”。
虽然AI确实有可能改变医疗保健行业,但许多这些说法被夸大了。实际上,AI的目的是增强而不是替代医生的工作。AI在处理复杂的长期患者病史方面存在困难,尽管LLMs可以支持决策,但它们仍然需要谨慎处理不确定性。简而言之,LLMs可以提供帮助,但仍然需要验证和安全检查以确保其准确性和可靠性。
科罗拉多大学安舒茨医学园区(CU Anschutz)最近举办了首届AI会议,主题为“与AI互动”。该活动提供了一个平台,探讨AI如何在各个学科中改变研究、教育和合作。生物医学信息学系(DBMI)创始主席Casey Greene博士表示:“在DBMI,我们为成为CU Anschutz的学术基础感到自豪,致力于将尖端技术无缝整合,坚定不移地推进临床卓越。”
在此次活动中,科罗拉多大学医学院生物医学信息学助理教授Yanjun Gao博士展示了来自语言、推理和知识(LARK)实验室的突破性研究。她的演讲集中在评估大型LLMs在临床实践中的应用,强调其在革新医疗诊断和患者护理方面的潜力。Gao还分享了将AI进展整合到临床工作流程中的持续计划,强调这些技术对医疗保健未来可能产生的变革性影响。
简化医患沟通
医生通常会收到大量患者消息,回复这些消息可能非常耗时。为了解决这个问题,微软和OpenAI在2023年与Epic合作,将ChatGPT-4集成到其电子健康记录(EHR)系统中。这项技术的第一个应用之一是自动化回复患者消息。然而,这种集成带来了自己的挑战,特别是在“提示工程”方面。编写有效的提示是获得准确可靠的LLM响应的关键,但这并不直观;它涉及反复试验。需要尝试不同的措辞和格式,以找到引导模型生成有用答案的最佳方式。对人类来说结构良好的提示不一定适用于AI,因为LLMs解释语言的方式不同。此外,沟通风格因医学专科而异,这使得在医疗保健中创建通用的提示策略变得困难。
为了解决这个问题,Gao及其团队开发了_Cliniciprompt_,这是一个旨在帮助非技术人员,尤其是在医疗保健领域,自动生成有效提示的软件框架。_Cliniciprompt_提供了一步步指南来创建提示,并包括内置指标以确保与使用的LLMs兼容。它还具有一个名为“检索增强生成”的工具,用于存储成功的提示示例以供重用。用户只需输入他们期望的结果,_Cliniciprompt_就会生成适当的提示来指导LLM。自2024年2月推出以来,_Cliniciprompt_取得了显著影响。护士的使用率达到了约90%,医生达到了约75%。这些改进显著提升了AI驱动的消息回复效果。_Cliniciprompt_也获得了全国认可,受邀在AMIA和Epic用户组会议等主要会议上展示。
预测不可预测性
医学中的一个重要挑战是处理不确定性。医生在做出诊断时经常面临不确定性,需要权衡诸如先验概率(测试前患者患有某种疾病的概率)和后验概率(测试结果后的概率)。正确处理这种不确定性对于避免误诊至关重要。Gao的研究探讨了大型语言模型(LLMs)如何辅助预测先验诊断概率,评估其在支持诊断决策方面的可靠性。问题是LLMs能否根据患者的病史和其他因素准确估计其患有特定疾病的概率。Gao解释说:“我们正在研究LLMs内部表示,如可能单词的概率分布,是否可以用来估计不确定性。”
研究团队将LLMs的预测与最先进的机器学习算法进行了比较,用于诊断如败血症、心律失常和充血性心力衰竭等疾病。Gao指出:“我们发现LLMs的内部表示与传统机器学习模型的预测之间存在相关性,但在某些情况下,LLMs在不确定性估计方面存在困难。”此外,LLMs预测中的偏差仍然是一个关键问题,特别是在种族和性别等因素影响AI预测时。解决这些问题对于在高风险医疗决策中部署AI至关重要。
数据总结和安全的临床应用
除了诊断支持,Gao的实验室还在研究两个旨在增强医疗保健中AI应用的项目。一个项目探索了LLMs如何总结复杂和广泛的患者数据,以减少临床医生的认知负担,并通过定制摘要弥合提供者和患者之间的沟通差距。尽管LLMs经过大量文本训练,设计用于处理长文本,但在总结纵向医疗记录方面仍存在困难,如幻觉和遗漏。Gao的实验室正在探索新的方法来改善这一能力,确保关键医疗见解被准确捕捉并有意义地呈现,以支持其效用。您可以在此了解更多有关该研究的信息。第二个项目专注于评估LLMs在临床任务中的安全性,特别是在生成临床文本方面。许多成功的LLMs今天是通过一种称为基于人类反馈的强化学习(RLHF)的方法进行训练的,这种方法使AI与人类偏好保持一致。Gao解释说:“我们正在评估这些方法是否可以确保LLMs在生成和评估临床文本时与人类价值观保持一致,特别是在医疗保健背景下。”她补充道:“虽然我们还没有所有的答案,但我们正在积极研究这些关键问题。”您可以在此了解更多。
Gao强调:“医疗保健中的人工智能不仅仅是一个热门话题。这个领域有许多令人兴奋的研究机会,但要实现其全部潜力,合作是必不可少的。”尽管Gao的实验室相对较新,但他们正在弥合技术专长和临床实践之间的差距。
Greene表示:“Gao博士的工作是负责任的人工智能进步的一个典型例子,可以增强而不是替代医疗保健中的关键人类元素。通过开发像_Cliniciprompt_这样的工具,并严格探索AI驱动诊断中的不确定性,她的团队正在帮助塑造未来的患者护理。”
【全文结束】


