摘要:帕金森病(PD)的前额纹状体退化与语言缺陷相关,这些缺陷可以通过自然语言处理识别,这是一种用于数字表型分析的强大工具。当前证据大多忽略了该病的认知表型。我们验证了一种基于人工智能的方法,以捕捉伴有或不伴有轻度认知障碍(PD-MCI、PD-nMCI)的帕金森病患者相对于健康对照组(HCs)的数字语言标记。通过分析参与者的连贯言语,使用CLAN软件提取语言特征。分类采用支持向量机(SVM)和递归特征消除(RFE)。区分PD与HCs的曲线下面积(AUC)达到77%,亚组分析结果更佳(AUC:PD-nMCI vs. HCs 为85%;PD-MCI vs. HCs 为83%;PD-nMCI vs. PD-MCI 为75%)。关键语言特征包括回溯比率、动作动词、话语错误和无动词话语比率。尽管样本量小可能限制统计功效和普适性,但本研究突显了语言数字标记在帕金森病早期诊断和表型分析中的潜在基础价值。
引言:帕金森病(PD)是一种因黑质纹状体通路中多巴胺能神经元退化导致的进行性神经系统疾病,由于基底神经节区域广泛细胞损失所致。除运动障碍外,PD还涉及多种认知缺陷,包括与构音障碍或其他运动症状无关的语言改变。事实上,多项研究表明语言评估是捕捉疾病早期标志的关键方法。
讨论:我们开发了一种结合计算语言学和可解释机器学习(ML)流程的方法,应用于有或无轻度认知障碍的帕金森病患者,以确定自然语言是否可以自动将患者分类为不同表型。各种语言测量与ML算法结合,可以成功实现帕金森病患者的半自动分类,即使在所有亚组中也是如此。在所有分类中,词汇语义和形态句法特征最具辨识力。此外,发现词汇语义和形态句法特征分别与MDS-UPDRS III和MoCA显著关联。先前的系统综述表明,语言测量可以作为监测帕金森病进展的可靠生物标志物,具有鼓舞人心的分类性能;然而,关于应用ML算法分类语音和语言模式的证据尚少。
结论:我们的研究建立在先前研究基础上,通过使用计算语言学和ML全面表征帕金森病及其相关MCI亚组的语言特征。不同于早期仅针对特定语言水平的研究,我们的综合方法提供了帕金森病不同语言模式的详细见解。这些结果突显了自动化语言分析作为可扩展、临床有用的工具在帕金森病早期诊断和表型分析中的前景。临床医生应特别关注帕金森病的语言相关问题,以更好地支持患者的沟通需求。
(全文结束)


