人工智能框架助力区分不同神经退行性疾病 - 认知障碍

2026年5月12日 | 瑞典隆德大学的一支计算科学家团队构建了一种深度联合学习蛋白质组学模型，以提高多种痴呆相关疾病的诊断准确性。这些疾病在初级医疗环境中由于缺乏有效生物标志物而诊断困难。博士后研究员兼模型创建者安立军博士表示，通过单次血液检测同时预测这些不同但相关的病理状况，将有助于快速、准确地进行鉴别诊断。

对于六种相关且经常共存的疾病——阿尔茨海默病、帕金森病、肌萎缩侧索硬化症（ALS）、额颞叶痴呆、既往中风以及健康衰老对照组，目前普通医生误诊或漏诊的概率约为50%。这主要是由于患者共享生物特征和症状，以及患者群体的显著差异和不同诊所对功能领域的测量方式不同。

这种新设计的模型名为"基于蛋白质组学的人工智能痴呆诊断系统"（ProtAIDe-Dx），是迈向更精确诊断方法的第一步。该模型利用迄今为止最大的神经蛋白质组学样本，有望实现神经退行性疾病的早期干预和个性化治疗，而这些疾病正在全球迅速增长。其潜力是近期发表在《自然医学》杂志上的一项研究的主题。

该建模工作利用了全球神经退行性疾病蛋白质组学联盟（GNPC）汇编的全球最大神经退行性疾病血浆蛋白质组学数据集。研究选择了17,000多名记忆诊所患者的子集，这些患者基于SomaLogic 7k蛋白质组学数据，样本来自19个贡献站点。

隆德大学政府支持的MultiPark转化项目研究小组负责人、安立军的导师雅各布·沃格尔博士指出，SomaLogic平台能够识别和测量数千种蛋白质，即"活人体内的功能效应分子"。将最先进的AI模型应用于大型蛋白质组学队列表明，ProtAIDe-Dx可以通过识别驱动患者层面决策的蛋白质，显著改进基于生物标志物的鉴别诊断。

任务学习

该领域并非没有进展。安立军表示，在过去几年中，研究人员已经发现了阿尔茨海默病的血液生物标志物（如p-tau217和淀粉样蛋白比率），这些标志物有望很快提高这种最常见痴呆病因的诊断准确性。

其他神经退行性疾病则不同，其确诊通常只有在尸检时才能实现。患者在世时通常基于临床病史、简短的认知筛查工具以及各种实验室检测来排除可逆病因而进行诊断。

安立军表示，希望有一种简单的血液检测能够梳理出分子线索。解决由年龄相关共病导致的误诊问题的起点，是开发基于血液的生物标志物，以高特异性识别潜在的神经退行性病理。

来自美国和欧洲不同队列的血样通过SomaLogic的蛋白质组学检测进行分析，该检测运行在因美纳高通量DNA测序平台上。从最初7,595种蛋白质中，筛选出数百种最相关的蛋白质用于多任务联合学习方法，使ProtAIDe-Dx模型能够识别疾病共病理。

安立军报告称，ProtAIDe-Dx在预测准确性方面优于多种机器学习和最先进的深度学习模型。当推广到多个独立数据集时，它也相对于目前可获得的临床生物标志物产生了更好的鉴别诊断。

沃格尔解释说，这种深度学习架构基本上是同时学习一个任务（例如，是否为阿尔茨海默病？）以帮助学习另一个任务（例如，是否为帕金森病？）。"同时学习它们会给每个单独任务带来净优势，因为深入数据中存在对所有[六种]任务都相关的信息。"

安立军解释说，在进行几千次迭代后，模型会内部定义赋予信息性蛋白质的"权重"。特征重要性技术也被用来排名、过滤和识别最具预测性的变量，同时减少噪声。

沃格尔表示，这种多诊断预测模型在十几个不同数据集上进行了测试，提供了对其在真实世界诊所中表现的准确估计。最终，了解模型在"野外"如何表现比仅基于计算技术找到最佳模型更为重要。

诊断标签

沃格尔表示，蛋白质组谱能够比临床诊断更好地预测认知能力下降，这一点并不令人意外。GNPC数据集"反映了现实生活……[其中]每个人都在以稍微不同的方式做诊断。"不仅临床医生可能得出不同的结论，而且这些诊断的置信度与高端技术（如PET和MRI扫描以及脑脊液分析）的可用性相关。

"在所有这些不同数据集的总和中，我们不知道诊断标签的真实准确性如何，"他说。"没有生物标志物很难准确诊断神经退行性疾病，而且我们对大多数疾病没有精确的生物标志物。"

沃格尔继续说，研究的另一个有趣发现是，具有相同临床诊断的个体似乎有不同的潜在生物学亚型。该模型对患者的分组"并不总是与临床医生分配的诊断完全对应，但它确实告诉我们一些……[即]有些人可能具有相似的生物学特征，但症状表现可能不同。"

他举例说，已知家族成员可能有相同的基因突变，但一人患上肌萎缩侧索硬化症，而另一人则发展为额颞叶痴呆。"问题变成了哪一部分信息是相关的——是症状还是生物学特征。"

对于选择治疗方案，临床医生可能想知道患者的潜在生物学特征。但如果涉及行为治疗，他们可能还想更多地了解症状。沃格尔表示，这些是"不同的实体，它们对我们追求治疗和患者管理都相关。"

缺失数据

沃格尔设想的理想世界中，多种疾病的诊断将通过基于血液的检测面板完成。"我们还没有完全达到这一点，至少使用这种血浆蛋白质组学的迭代还没有。"

尽管ProtAIDe-Dx模型与许多不同疾病的多个方面高度相关，但它尚未达到可以单独用于确诊的程度。但将该模型的输出与阿尔茨海默病生物标志物、影像扫描和认知测试的信息相结合，应该会大大改善这种情况。

他补充说："如果你使用这种蛋白质组学数据设定非常严格的阈值，你也可以得出相当确定的生物学诊断。"问题是，只有10%至20%的个体诊断是确定的。

沃格尔说，缺失的是数据，他将此与开发阿尔茨海默病血液检测的几十年过程进行了类比，该过程曾断断续续地进展。SomaLogic的亲和力技术仅提供蛋白质的一种视角。其他视角可从邻近延伸分析法（如奥林克蛋白质组学）获得，后者使用下一代测序来识别和量化蛋白质，以及质谱法，后者提供了更广泛、更详细的肽、片段和翻译后修饰阵列。血液中发现的脑源性细胞外囊泡也是神经退行性疾病的有前景的、非侵入性的早期检测生物标志物。

他说："我们使用的AI方法很棒，因为它们可以从大海捞针中找到关键信息，并以个人使用电子表格永远无法做到的方式组合信息。这只是继续大量生成数据并对其进行分析……直到我们找到想要的东西的问题。"

沃格尔表示，到那时，工作将开始将候选蛋白质缩小到最小可能的面板，而不损失诊断价值。这将通过降低成本以及更容易复制和维护质量控制来使测试可扩展。

他说："如果你有某种极其准确的东西，无论成本如何，人们都会使用它。"如果一项测试需求很高，随着供应方调整，价格最终会下降。目标是用最少的开销获得最大的临床效用。

生物标志物面板

单次血液检测诊断多种神经退行性疾病是这里的长期目标。"生物标志物对我们追求治疗和患者管理的重要性怎么强调都不为过，"沃格尔说。"当你患病时，有人告诉你'我确切知道你患有什么病'会带来极大的解脱……这为患者打开了一个可能性的世界，而如果他们不知道，这些可能性就无法获得。"

他说，多年来，阿尔茨海默病治疗研究的主要障碍之一是临床试验中许多人实际上并不患有该疾病，因为没有生物标志物来诊断他们。"随着生物标志物的存在，痴呆研究和治疗的方方面面都得到了改善"，包括跟踪疾病进展和对药物的反应。

沃格尔表示，在单一疾病基础上，生物标志物越来越多地用于临床试验以提高诊断信心。这特别包括帕金森病，其中测量脑脊液中的α-突触核蛋白。

最近，针对4R tau蛋白病（一组由脑中tau蛋白四重复异构体病理性积累定义的神经退行性疾病）的生物标志物已经出现，这些疾病通常表现为非典型帕金森综合征。从蛋白质组学分析中，研究还发现与基于突触损伤的认知障碍进展密切相关的蛋白质。

这都指向了组装生物标志物面板的可能性。"过去几年在该领域取得了 excellent 进展，"沃格尔说，他希望拥有一种多诊断测试，比他曾经准备的十年或更长时间更快地进入市场。

未来工作

沃格尔表示，他和团队工作的痴呆多组学和神经影像学实验室的一个主要重点是与同事合作，更好地理解神经退行性疾病的异质性及其如何影响治疗反应。ProtAIDe-Dx模型也可能在World-Wide FINGERS正在进行的临床试验中发挥作用，这是一个基于里程碑式的芬兰老年干预研究以预防认知障碍和残疾的研究网络，证明同时改变生活方式可以改善高风险老年人的认知能力。

安立军表示，他在沃格尔实验室接触到了临床蛋白质组学精准医学项目，所分析的数据复杂性很容易被低估。他强调，繁忙的高维数据需要先进的、专门的计算方法来产生有趣的发现，这些发现可以被验证以支持精准医学。

沃格尔说："[我们]都知道，如果你添加更多数据，你就更有可能找到真相，但如果我们的协调和标准化更好，任务会更容易……我们可能只需要更多地合作……并[提前]汇集我们的数据。"

【全文结束】

人工智能框架助力区分不同神经退行性疾病AI Framework for Differentiating Neurodegenerative Diseases