一项由Maccabi KSM研究和创新中心和Predicta Med进行的突破性研究表明,机器学习模型可以通过分析电子病历(EMR)来识别未确诊的乳糜泻高风险患者。该研究结果发表在《Nature Portfolio》旗下的《Scientific Reports》期刊上,指出这些模型可以在首次记录疾病证据前最多提前四年识别出乳糜泻患者。该研究已获得赫尔辛基委员会的伦理批准。
乳糜泻影响全球约1%的成人和儿童,但许多人在确诊前经历了多年的症状折磨。研究表明,有些人可能需要超过十年才能得到确诊。目前,乳糜泻通过血清学测试和肠活检诊断,但确定谁应该接受检测是一个挑战,尤其是在成年人中,他们可能有多种症状或无症状。
在这项研究中,研究人员分析了来自Maccabi医疗保健服务公司(一家领先的以色列健康维护组织)的匿名EMR数据,涵盖超过290万名患者的数据。研究人群包括抗体组织转谷氨酰胺酶(tTG-IgA)水平极高的患者和无乳糜泻记录的对照组患者。
研究人员使用常见的实验室测试和基本的人口统计信息(性别和年龄)训练机器学习模型,并评估其区分两类患者的能力。曲线下面积(AUC)用于评估模型区分病例和对照患者的能力。AUC得分范围从0到1,分数越高表示性能越好。模型在初次乳糜泻阳性血清学测试前一年至四年的不同时间间隔进行了测试,最终导致患者被确诊。
研究人员训练并测试了五种算法:逻辑回归、决策树、随机森林、XGBoost和多层感知机。其中,XGBoost表现最佳,在诊断前一年的AUC得分为0.86,并在长达四年的更长时间间隔内保持较高的准确性(AUC > 0.8)。未确诊乳糜泻自身免疫的关键预测因素包括低血红蛋白、低铁蛋白、低高密度脂蛋白胆固醇(HDL)和升高的肝功能测试。
这项研究提供了一个有希望的框架,利用机器学习检测乳糜泻高风险患者,展示了利用常规临床数据进行早期检测的可行性。这种方法有可能整合到拥有全面EMR系统的医疗实践中。
“早期识别乳糜泻可以显著改善患者预后,因为早期诊断的患者通常会有更好的肠道愈合和减少的症状,而延迟诊断则与即使遵守无麸质饮食仍持续存在的健康问题有关。”Maccabi KSM研究和创新中心的儿科胃肠病学家和高级临床研究员Amir Ben-Tov博士说道。
开发的工具未来可能会演变为一种预筛查方法,标记患者进行进一步评估,包括血清学测试和活检。Predicta Med正在与美国领先医院进行试点,以证明该工具在前瞻性环境中的有效性。与加州一家主要医院正在进行的研究显示,AI指示与临床医生的疾病风险评估高度一致。
(全文结束)


