阿姆斯特丹——随着人工智能(AI)越来越多地嵌入医疗保健领域,包括肝脏护理,至关重要的是将AI定制到当地人群,并确保定期监测模型,以确保患者的治疗既有效又安全。
Ashley Spann博士是一名移植肝病学家,她在范德比尔特大学医学中心(Vanderbilt University Medical Center)致力于开发信息学和AI,以优化肝脏疾病(包括移植)的治疗效果。在2025年欧洲肝脏研究协会(EASL)大会上,她在一个关于AI对肝病实践影响的会议上分享了有关伦理和如何在肝脏诊所实施AI的建议。
Spann博士强调:“我们需要从一开始就包括患者和提供者,而不是孤立地进行构建。数据必须代表关注的人群,技术解决方案必须适合临床问题,并且模型不能造成伤害。”
她强调,临床护理的原则,特别是不伤害原则,在使用AI时也有一席之地。“AI已经存在于我们周围。问题是:我们应该使用它吗?如果使用,我们该如何负责任地使用它?”
为此,Spann讨论了模型开发、临床实施以及她称之为“算法警戒”的关键保障措施:在部署后持续监测AI模型,以检测性能漂移并防止伤害。“我们可以通过为模型设置参数来最小化伤害,这样我们就可以实时知道何时性能开始下降并可能影响患者。如果这种情况发生,我们会关闭模型,重新评估、重新训练并重新部署。”
“从构思到部署的每一步,我们都必须跟踪模型的行为,确保它不会使患者的护理变得更糟。”她说。
购买还是构建——采用的关键问题
Spann强调了从临床问题出发,然后分层加入适当的AI技术的重要性,同时始终考虑保护患者。
无论是构建还是购买模型,确保其反映关注人群的需求是至关重要的。大多数AI模型都是基于历史医疗数据进行训练的。这意味着它可能会反映出系统性不平等,例如特定人群中的风险因素患病率、诊断不足、治疗不足或边缘化群体缺乏医疗服务。在这种情况下,模型会学习并复制这些模式。
“我们必须确保偏见和不平等不会恶化,”她说。“如果一个模型开始表现不佳,我们需要知道何时以及如何干预。”
Spann敦促临床医生和机构在决定哪个模型合适时,要仔细审查可用的数据。例如,在构建模型时,她建议询问数据集中某些患者群体是否比其他群体更受影响。如果购买模型,她建议询问该模型是否解决了需要解决的临床问题。
例如,AI可能是识别未被发现的肝硬化人群的一种解决方案,通过人口层面的方法来解决问题。“重要的是要问哪些数据可用于做出这种预测,是否有某些患者受到不成比例的影响?可能有些患者没有可用的数据,尽管他们可能患有疾病,这对他们的影响是什么?”
她引用了她所在机构的一个例子,其中Fibrosis-4 (FIB-4) 指数被整合到电子健康记录中,以自动化肝脏纤维化风险分层。超过一半的患者缺乏生成FIB-4分数所需的关键实验室值。“他们可能仍然有疾病,但没有这些实验室数据,我们无法知道风险的严重程度。问题变成了我们需要哪些数据以及如何获取这些数据?这是一个具有实际影响的数据缺口。”Spann解释说。
不匹配的人群会使模型失效
当购买AI模型时,Spann警告不要将其应用于与其训练数据所代表的人群差异过大的人群。她引用了一个使用美国退伍军人事务系统数据开发的模型为例,该系统主要包含年龄较大的白人男性患者,因此可能无法很好地推广到服务更多样化人群的城市中心。“这个人群是非常独特的患者子集。唯一确定其适用性的方法是取该模型并进行回顾性测试,看看模型可能会如何变化,然后在当地随时间跟踪其性能。”
她还强调了社会经济因素,如距离移植中心或肝病诊所的距离,可能会扭曲结果,而这些因素在模型的临床输入中很可能没有考虑到。“我们需要考虑模型在这些亚组中的表现,因为它在这些亚组中可能是错误的。”
AI在公共卫生中的作用
会议共同主持人Tom Luedde博士是德国杜塞尔多夫海因里希·海涅大学的主任,他考虑了AI在肝脏护理中的潜在影响。“预防、检测、风险预测以及实际上让患者进入医疗系统是我们肝脏疾病管理中的最大缺陷。AI可以帮助填补这些空白,”他说。“目前,全科医生还没有在日常实践中实施FIB-4,但通过大型语言模型或AI系统,我们可以让患者更容易接触到肝病系统。我相信,通过这些方法,我们将比任何单一药物或复杂干预措施产生更大的影响。未来,我可以看到AI被应用在一种健康亭中。鉴于我们面临的所有资源问题,这可能会有所帮助。”
(全文结束)


