摘要
目的
电子健康记录(EHR)包含大量非结构化的患者数据,可以利用人工智能(AI)进行挖掘。本研究旨在开发一种自然语言处理(NLP)流程,从电子健康记录中识别系统性红斑狼疮(SLE)患者的临床表型和疾病轨迹。
方法
纳入了SLE患者的电子健康记录数据。设计了一个结合人工智能(AI)和人类智能(HI)的标准化逐步框架。为临床领域、疾病发作和疾病复杂性表型(低、中、高)在初次接触时制定了基于本体论的定义,并使用基于NLP的流程提取了相应数据。
结果
从提取的1,000名患者中,有262名患者符合纳入标准,这些患者有≥1次住院、≥1次门诊就诊,且随访≥1.5年。其中,88%为女性,中位年龄为43岁,中位随访时间为6年。在初次接触时,最常涉及的临床领域是血液系统(64%)、关节(47%)、皮肤(59%)和肾脏(58%)。在初次接触时,43%的患者表现为高复杂性表型,35%为中等复杂性,22%为低复杂性:第一组随时间推移经历了更多的疾病发作(5次对比3次和3次,P<0.001)。低复杂性和中等复杂性表型的患者在随访期间表现出新的临床领域增加更多,并且常规免疫抑制剂、生物制剂和糖皮质激素的使用增加更多。
结论
这种基于真实世界数据的新框架,能够对SLE患者进行纵向表型特征描述。它显示出作为研究SLE异质性及其随时间进展的可行工具的潜力,为临床研究和患者管理的潜在应用提供了见解。
【全文结束】

