一项研究表明,通过机器学习模型分析电子健康记录(EHR)中的临床医生笔记,可以准确识别抗中性粒细胞胞浆抗体相关性血管炎(AAV)病例。该模型在识别AAV病例方面优于传统的基于诊断代码的算法,研究人员指出:“将其应用于EHR笔记中,可以潜在地发现传统规则方法遗漏的额外病例。”
这项研究题为“使用深度学习和电子健康记录识别抗中性粒细胞胞浆抗体相关性血管炎队列”,发表在《国际医学信息学杂志》上。
AAV是一种罕见的自身免疫性疾病,其中自反应性抗体(ANCAs)异常激活免疫系统中的中性粒细胞,导致小血管受损。根据受损组织或器官的不同,AAV可表现为多种症状,包括肺部、肾脏、神经系统和皮肤问题。
研究人员写道:“在电子健康记录(EHR)中识别AAV病例对于流行病学研究越来越重要,但目前缺乏有效的方法来识别这些病例。” 流行病学是指研究不同人群中疾病的频率及其原因。
现有的用于识别AAV病例的规则算法依赖于EHR信息,如ANCA测试结果和ICD-9代码(美国用于指定诊断和程序的代码)。由于微观多血管炎(MPA)这种常见的AAV类型没有特定的ICD-9代码,“许多MPA患者可能被误编为不具体的ICD-9代码”。
除了ICD-9代码和测试结果,EHR数据还包括由临床医生输入的自由文本,用于记录患者的诊断、症状及相关特征。研究人员写道:“临床笔记包含丰富的信息,如临床表现、体格检查和鉴别诊断,这些信息有助于确定患者是否患有AAV。”
其他疾病的研究表明,当查看这种类型的非结构化EHR数据时,病例查找算法可能会变得更加有效。然而,这种方法是否也适用于识别AAV病例尚不清楚。
布里格姆妇女医院和哈佛医学院的科学家们利用机器学习从EHR中的非结构化临床笔记中提取和分析信息。机器学习是一种形式的人工智能,它使用计算机算法从数据中学习并识别和预测模式。
研究团队首先从马萨诸塞州总医院布里格姆的研究患者登记处收集数据,确定了88,902个潜在的AAV病例,这些病例至少有一个与AAV相关的ICD-9代码或专家整理的临床笔记中的关键词。
然后,研究团队使用三个不同的患者群体开发和评估用于从临床笔记中识别AAV病例的机器学习算法。组A包括700名确诊的AAV患者,而组B和组C是从1,000名潜在AAV患者中随机抽取的样本。
对于每个组,临床笔记被提取并处理成较小的部分。如果任何笔记部分被预测为阳性,则建议存在AAV;如果所有笔记部分都被预测为阴性,则认为患者非AAV。
研究人员随后创建了三个数据集来测试不同的机器学习算法。数据集1包含来自组A的5,000个笔记部分和来自组B的1,000个笔记部分,所有部分都提到特定关键词。
数据集2包含来自组A的2,000个部分和来自组B的1,000个部分,这些部分是随机选择的,而不考虑特定关键词;数据集3则由来自组C的7,500个随机笔记部分组成。
经过不同机器学习模型的运行,一种名为分层注意力网络(HAN)的模型在区分AAV和非AAV病例方面表现出最佳性能。在所有三个数据集中,HAN的准确性均超过98%。
研究团队将HAN算法与两种基于规则的算法进行了比较,这些算法使用来自组D的数据,组D由从筛选队列中随机抽取的2,000名个体组成。
第一个算法(规则1)基于AAV相关的ICD代码,第二个算法(规则2)基于ICD代码和六个月内使用AAV药物的情况。
使用规则1,从组D中识别出218人。排除12名信息不足的患者后,有40人(19.4%)被确认患有AAV。规则2识别出52名患者,其中11人(21.2%)被确认患有AAV。HAN分析了近2,000份临床笔记,预测177人患有AAV,其中45人(26.2%)被确认患有AAV。
总体而言,HAN估计的敏感性(即正确识别AAV的能力)为97.5%,规则1为87%,规则2为23.9%。
机器学习还识别出更多的ANCA阴性AAV病例和西班牙裔背景的患者:HAN识别的比例为24%,而规则1为2.5%,规则2为0%。HAN还检测到规则1未识别的六个额外病例,占阳性病例的13%,而规则1发现了一个HAN未识别的患者。
研究人员总结道:“这是首次证明深度学习算法可以高效且准确地识别AAV病例,部分原因是仅使用非结构化的EHR数据。这种方法具有识别仅使用结构化EHR数据可能遗漏的病例的潜力。”
(全文结束)


