一项突破性的AI模型通过分析多样数据,揭示了黑人女性阿尔茨海默病(AD)进展更快的现象,为早期检测和个性化护理提供了一个强大的工具。
研究背景
阿尔茨海默病影响认知、记忆和行为,早期检测对于优化治疗效果至关重要。目前的研究大多针对轻度认知障碍(MCI)或晚期症状的个体,而很少研究有正常认知但处于AD进展风险的无症状个体。这种代表性不足在西班牙裔/拉丁裔和黑人/非裔美国人中尤为明显,尽管这些群体面临更高的AD风险,但较少被纳入临床试验。导致这一差距的因素包括不信任、社会经济障碍和后勤挑战,这些因素使跨多样化人群的数据收集变得复杂。机器学习在神经学中越来越被用于疾病进展预测,可以实现更早的检测和干预。然而,传统模型难以处理生物医学数据的复杂性和高维度。可扩展的深度学习模型更适合识别多样风险因素之间的模式,可能增强AD风险预测,支持公平和包容的AD研究。鉴于这些挑战,研究人员开发了一种多头深度学习模型来预测AD进展,识别关键预测因子并对参与者进行聚类,以捕捉人口级别的异质性。
研究方法
研究人员利用国家阿尔茨海默病协调中心(NACC)提供的全面、高维数据,构建了一个多头预测深度学习模型。该模型的独特结构能够处理大型数据集,结合生物医学和影像数据,以增强AD进展预测、聚类和特征提取。进行了广泛的预处理以精炼数据并减轻潜在偏见,包括特征选择、平衡方法和处理缺失值,最终纳入了6,110名参与者和447个特征,涵盖各个领域。约63%的参与者为女性,87%为白人(包括5%的西班牙裔/拉丁裔),13%为黑人或非裔美国人。大多数参与者在初次就诊时年龄超过61岁,为这一年龄段提供了大量数据。
多头神经网络模型使用多模态数据和融合策略来学习和区分复杂的相互作用。这种方法独特地结合了卷积神经网络(CNN)、长短期记忆网络(LSTM)和XGBoost模型,以捕捉纵向数据并高精度预测疾病进展。进一步的分析包括基于SHAP的特征提取和聚类,识别出疾病进展的主要预测因子,如临床痴呆评分、中风、抑郁和糖尿病,并验证了人口异质性。
结果与讨论
大约61%的参与者缺少风险基因载脂蛋白E4(APOE4)等位基因,27%有1个拷贝,3%有2个拷贝。多模态、多头、早期融合、两层CNN模型在关键指标上优于14个单模态模型,包括准确性、精确性、召回率和F1分数,展示了强大的模式识别和不平衡类别预测能力。
参与者根据进展速度被分类为四个集群:非转换者(80%)、缓慢转换者(14%)、中等转换者(4%)和快速转换者(2%)。黑人/非裔美国人参与者,尤其是女性,显示出比白人参与者更快的疾病进展和更大的变异性,其中非转换者仍然是各性别和种族中最大的群体。值得注意的是,黑人/非裔美国女性在快速转换组中跳过了MCI阶段,直接进展到痴呆,而白人女性则倾向于经历中间的MCI阶段。这一趋势突显了种族和性别如何影响AD进展,黑人/非裔美国女性表现出更早的疾病发作和在所有集群中更大的变异性。基于MRI的预测因子虽然有影响力,但在预测特定过渡到MCI/痴呆方面排名较低。
结论
总之,这项研究表明,多头深度学习模型能够有效应对AD的复杂性,揭示了进展集群中的显著异质性,并提供了关于人口统计学如何影响疾病进展的新见解。黑人/非裔美国人参与者,特别是女性,显示出比白人参与者更早和更可变的疾病进展。未来,这种方法可能支持针对最高风险人群的筛查方法的开发。
参考文献:
Chang, C. Y., Slowiejko, D., & Win, N. (2024). Prediction and clustering of Alzheimer's disease by race and sex: A multi-head deep-learning approach to analyze irregular and heterogeneous data. Scientific Reports, 14(1), 1-12. DOI: 10.1038/s41598-024-77829-1,
(全文结束)


