剑桥科学家开发的一种机器学习算法能够在100个病例中正确识别97例是否患有乳糜泻。这种AI工具已经在来自四家NHS医院的近3400份扫描活检样本上进行了训练,可以加快该病的诊断速度,并减轻紧张的医疗资源压力,同时还能改善发展中国家因病理学家短缺而难以诊断的情况。
数字工具已经开始显示出减少对病理学家需求的真正潜力。大量的工作集中在癌症检测上,但研究人员也开始寻找诊断其他类型疾病的机会。剑桥大学的科学家正在研究的一种疾病是乳糜泻,这是一种由摄入麸质引发的自身免疫性疾病。其症状包括腹痛、腹泻、皮疹、体重下降、疲劳和贫血。由于个体间症状差异很大,患者常常难以获得准确的诊断。
目前,诊断乳糜泻的金标准是通过十二指肠(小肠的一部分)活检。病理学家会在显微镜下或在计算机上分析样本,寻找绒毛(小肠内壁上的细小毛发状突起)的损伤情况。解释活检结果通常具有主观性,病理学家使用称为Marsh-Oberhuber量表的分类系统来判断病情的严重程度,从零(绒毛正常,患者不太可能患病)到四(绒毛完全扁平)。
今天发表在《新英格兰医学杂志AI》上的研究表明,剑桥大学的研究人员开发了一种机器学习算法来分类活检图像数据。该算法在一个包含超过4000张图像的大规模、多样化数据集上进行了训练和测试,这些图像来自五家不同医院,使用了四个不同公司的五种不同扫描仪。
剑桥大学病理学系和丘吉尔学院的资深作者Elizabeth Soilleux教授说:“乳糜泻影响多达百分之一的人口,并可能导致严重的疾病,但确诊并不简单。确诊可能需要很多年的时间,在医疗系统面临巨大压力的情况下,这些延误可能会继续存在。AI有潜力加速这一过程,使患者更快地得到诊断,同时减轻NHS等候名单的压力。”
研究团队在一个独立的数据集上测试了他们的算法,该数据集包含来自一个未见过的来源的近650张图像。根据与原始病理学家的诊断比较,研究人员发现该模型在超过97%的病例中诊断正确。该模型的敏感性超过95%,意味着它正确识别了100名乳糜泻患者中的95名以上。它的特异性接近98%,意味着它正确识别了100名非乳糜泻患者中的98名左右。
之前的研究表明,即使是病理学家之间也可能存在诊断分歧。当向一组病理学家展示100张幻灯片并要求他们诊断患者是否患有乳糜泻时,研究显示在超过五分之一的病例中存在分歧。这一次,研究人员请四位病理学家审查了30张幻灯片,发现一位病理学家与AI模型达成一致的可能性与另一位病理学家相同。
剑桥大学病理学系和休斯厅研究员Florian Jaeckle博士说:“这是首次证明AI能够像经验丰富的病理学家一样准确地诊断一个人是否患有乳糜泻。因为我们用在多种条件下生成的数据集对其进行训练,我们知道它应该能够在广泛的设置中工作,即使在处理和成像方式不同的情况下也能适用。”
“这是朝着加速诊断和让病理学家有更多时间专注于更复杂或紧急病例的重要一步。我们的下一步是在更大的临床样本中测试该算法,使我们能够将此设备提交给监管机构,从而更接近于在NHS中使用该工具。”
研究人员一直在与患者团体合作,包括通过乳糜泻英国组织,分享他们的方法并与他们讨论对这种技术用于诊断乳糜泻的接受程度。“当我们与患者交谈时,他们通常非常接受使用AI来诊断乳糜泻,”Jaeckle博士补充道。“这无疑部分反映了他们在获取诊断过程中遇到的困难和延迟。”
“患者和临床医生经常提到的一个问题是‘可解释性’——能够理解和解释AI是如何做出诊断的。作为研究人员和监管者,我们需要牢记这一点,以确保公众对AI在医学中的应用的信任。”
Soilleux教授和Jaeckle博士已经成立了一家名为Lyzeum Ltd.的衍生公司,以商业化该算法。
乳糜泻英国组织的研究员Keira Shepherd说:“在诊断过程中,患者必须保持饮食中含有麸质,以确保诊断准确。但这会引起不适的症状。因此,尽快获得准确诊断非常重要。这项研究展示了加快诊断过程的一种潜在方法。在乳糜泻英国组织,我们为这项工作的早期阶段提供了资金支持,最初的重点是训练一个系统来区分健康对照活检和乳糜泻患者的活检。我们希望有一天这项技术能够帮助患者快速准确地得到诊断。”
这项研究得到了乳糜泻英国组织、创新英国、剑桥数据驱动发现中心、加速科学发现计划(由Schmidt Sciences捐赠资助)和国家卫生与护理研究所的支持。
(全文结束)


