剑桥科学家开发的一种机器学习算法能够在100例中有97例正确识别个体是否患有乳糜泻。这项研究基于来自四家NHS医院的近3,400张扫描活检图像进行训练。
这种AI工具可以加快乳糜泻的诊断速度,并减轻紧张的医疗资源压力,特别是在病理科医生短缺的发展中国家。数字工具已经开始显示出减少病理科医生工作量的潜力,其中大部分工作集中在癌症检测上,但研究人员也开始探索其他疾病的机会。
剑桥大学的科学家们正在研究的一种疾病是乳糜泻,这是一种由摄入麸质引发的自身免疫性疾病。其症状包括腹痛、腹泻、皮疹、体重下降、疲劳和贫血。由于症状因人而异,患者常常难以获得准确的诊断。
乳糜泻的金标准诊断方法是通过十二指肠(小肠的一部分)活检。病理学家会通过显微镜或计算机分析样本,寻找绒毛(小肠内壁上的细小毛发状突起)的损伤情况。
解读活检结果可能具有主观性,因为变化往往很微妙。病理学家使用一种称为Marsh-Oberhuber分级系统来判断病情的严重程度,从零级(绒毛正常,患者不太可能患有此病)到四级(绒毛完全扁平)。
剑桥大学的研究人员开发了一种机器学习算法,用于分类活检图像数据。该算法在一个大规模、多样化的数据集上进行了训练和测试,该数据集包含从五家不同医院使用四种不同公司的五种不同扫描仪获取的超过4,000张图像。
“乳糜泻影响多达百分之一的人口,并可能导致严重疾病,但获得诊断并不容易。许多患者需要多年才能得到准确的诊断,在医疗系统面临巨大压力的情况下,这些延误可能会继续存在。AI有潜力加速这一过程,使患者更快地获得诊断,同时减轻NHS等待名单的压力。”剑桥大学病理学系和丘吉尔学院教授Elizabeth Soilleux说。
研究团队在一个独立的数据集上测试了他们的算法,该数据集包含近650张来自未见过的来源的图像。基于与原始病理学家诊断的比较,研究人员发现该模型在超过97%的情况下诊断正确。
该模型的灵敏度超过95%,意味着它在100名患有乳糜泻的个体中正确识别了超过95例。其特异性接近98%,意味着在100名未患乳糜泻的个体中正确识别了近98例。
此前的研究表明,即使是病理学家之间也可能存在诊断分歧。当向一组病理学家展示100张切片并要求他们诊断患者是否患有乳糜泻时,研究团队发现超过五分之一的情况下存在分歧。
这一次,研究人员让四位病理学家审查了30张切片,发现病理学家与AI模型的一致性与两位病理学家之间的一致性相同。
剑桥大学病理学系和休斯霍尔学院研究员Florian Jaeckle博士说:“这是首次证明AI能够像经验丰富的病理学家一样准确诊断个体是否患有乳糜泻。因为我们用多种条件下生成的数据集对其进行训练,我们知道它应该能够在广泛的设置下工作,即使活检处理和成像方式不同。”
“这是加快诊断速度并释放病理学家时间专注于更复杂或紧急病例的重要一步。我们的下一步是在更大的临床样本中测试该算法,使我们能够将该设备提交给监管机构,从而更接近于在NHS中使用该工具。”
研究人员一直在与患者群体合作,包括通过乳糜泻英国组织,分享他们的方法并讨论他们对使用此类技术的接受程度。
Jaeckle博士补充说:“当我们与患者交谈时,他们通常非常愿意接受使用AI来诊断乳糜泻。这无疑部分反映了他们在获得诊断过程中遇到的困难和延误。”
“患者和临床医生经常提到的一个问题是‘可解释性’——能够理解和解释AI如何得出诊断。作为研究人员和监管者,我们必须牢记这一点,以确保公众对AI在医学中的应用充满信任。”
Soilleux教授是剑桥大学医院NHS基金会信托基金的血液病理学顾问。她与Jaeckle博士共同成立了一家名为Lyzeum Ltd的公司,以商业化该算法。
这项研究得到了乳糜泻英国组织、创新英国、剑桥数据驱动发现中心和国家健康与护理研究所的资助。
乳糜泻英国组织的研究官员Keira Shepherd说:“在诊断过程中,患者必须保持饮食中含有麸质,以确保诊断准确。但这会导致不适的症状。因此,他们能够尽快获得准确的诊断非常重要。”
“这项研究展示了一种可能加速诊断过程的方法。在乳糜泻英国组织,我们为这项工作的早期阶段感到自豪,最初的重点是训练一个系统来区分健康对照组的活检和乳糜泻患者的活检。我们希望有一天这项技术能够帮助患者快速准确地获得诊断。”
(全文结束)


