研究:学习策略提高医院AI模型效率Research: Learning Strategies Boost AI Model Efficiency in Hospitals

环球医讯 / AI与医疗健康来源:www.miragenews.com加拿大 - 英语2025-06-05 00:00:00 - 阅读时长3分钟 - 1316字
约克大学的一项新研究表明,主动、持续和迁移学习策略对于减轻数据偏移及其潜在危害至关重要,特别是在医疗应用中。
医院AI模型数据偏移患者健康迁移学习持续学习临床诊断模型性能数据偏见医疗应用健康领域
研究:学习策略提高医院AI模型效率

如果用于训练医疗应用(如大多伦多地区的医院)的人工智能模型的数据与现实世界的数据不同,可能会导致患者受到伤害。约克大学今天发布的一项新研究发现,主动、持续和迁移学习策略对于减轻数据偏移及其后续危害至关重要。

为了确定数据偏移的影响,研究团队构建并评估了一个早期预警系统,以预测住院患者的死亡风险,并增强七家大型医院的患者分诊。

该研究使用了加拿大最大的医院数据共享网络GEMINI,来评估数据偏移和偏差对临床诊断、人口统计学、性别、年龄、医院类型、患者转院来源(如急性护理机构或疗养院)以及入院时间的影响。研究包括了143,049次患者就诊记录,如实验室结果、输血、影像报告和管理特征。

“随着医院中越来越多地使用AI来预测从死亡率到住院时间、败血症以及疾病诊断等各种情况,确保这些AI按预期工作且不会造成伤害的需求越来越大,”约克大学健康政策与管理学院助理教授Elham Dolatabadi说。“然而,由于数据随时间变化导致系统不可靠,建立可靠且强大的机器学习模型变得非常困难。”

她补充说,用于训练医院和其他医疗环境中临床AI模型的数据需要准确反映患者的多样性、疾病和医疗实践。否则,模型可能会产生无关或有害的预测,甚至不准确的诊断。患者亚群体、人员配置、资源的不同,以及政策或行为的意外变化、医院之间的不同医疗实践或突发的大流行病,都可能导致这些潜在的数据偏移。

“我们发现,在模型训练和实际应用之间存在显著的数据偏移,包括人口统计学、医院类型、入院来源和关键实验室检测的变化,”第一作者、大学健康网络的AI科学家Vallijah Subasri说。“我们还发现,当在社区医院患者就诊数据上训练的模型转移到学术医院时,会出现有害的数据偏移,但反之则不然。”

为了减轻这些潜在的有害数据偏移,研究人员使用了迁移学习策略,使模型能够存储从一个领域学到的知识并将其应用于不同的但相关的领域,以及持续学习策略,即通过连续的数据流更新AI模型,以响应漂移触发的警报。

尽管机器学习模型通常在批准使用后保持锁定状态,但研究人员发现,利用迁移学习的特定于医院类型的模型比使用所有可用医院数据的模型表现更好。

使用漂移触发的持续学习有助于防止由COVID-19大流行引起的数据偏移,并随着时间的推移提高了模型性能。

根据其训练数据,AI模型也可能具有某些偏见,导致对某些患者群体不公平或歧视性的结果。

“我们展示了如何检测这些数据偏移,评估它们是否对AI模型性能产生负面影响,并提出缓解其影响的策略。我们表明,从承诺到实践有一条实用路径,弥合了AI在健康领域的潜力与在现实临床环境中部署和维持它的现实之间的差距,”Dolatabadi说。

这项研究是迈向临床AI模型部署的关键一步,因为它提供了确保这些模型在现实环境中安全和有效的策略和工作流程。

“这些发现表明,结合迁移和持续学习的主动、标签无关的监控管道可以检测并减轻多伦多普通内科人群中的有害数据偏移,确保稳健和公平的临床AI部署,”Subasri说。

该论文《诊断和修复有害数据偏移以负责任地部署临床AI模型》今天发表在《JAMA Network Open》期刊上。


(全文结束)

大健康
大健康