作为接受过数学、工程学和神经科学训练的计算神经科学家,我们长期从事理论神经科学和脑动力学计算模型研究。基于这一背景,将我们的工作扩展到脑部疾病诊断领域似乎是水到渠成的下一步。最初,我们惊讶地发现直接测量脑活动在临床诊断和治疗中几乎不起作用(癫痫是一个显著例外)。这似乎为理论驱动的方法提供了一个绝佳机会,可以产生实质性影响。
然而,随着我们深入文献研究,发现许多尝试开发可靠的基于脑活动的生物标志物的努力都未成功。自然地,我们认为自己可以做得更好。但在分析了数年用于帕金森病、阿尔茨海默病和焦虑症等疾病患者分类的fMRI和M/EEG数据后,我们自己也遇到了同样的挫折。尽管分析方法日益复杂,人工智能方法也愈发强大,但分类性能很少能达到临床实践真正有用或可靠的水平。文献中充斥着类似尝试,产生了看似有希望但最终无法普遍适用的结果。这促使我们重新思考定义脑部疾病生物标志物的整个研究计划。这篇观点文章正是这一反思的成果。
为什么基于脑部的生物标志物经常失败?
一个主要原因是脑部特征的多重性。不同的潜在脑机制可以产生相同的症状表现,而相似的脑活动模式可能因个体和情境不同而导致不同结果。因此,症状与脑活动测量之间不存在简单的一一对应关系。
这一问题被标准的队列比较方法所放大,参见漫画插图。大多数生物标志物研究将患者群体与健康对照组进行比较,同时隐含地假设每个组内部是同质的,并且脑活动与脑部疾病之间存在一一对应关系。然而,如果被诊断患有相同疾病的患者可能源于非常不同的潜在脑状态,那么跨队列的平均化实际上可能会掩盖相关机制,而非揭示它们。
另一个问题是所谓的"欠采样问题"。脑功能是从多个尺度——分子、细胞、网络、行为和环境——的相互作用中产生的。然而,大多数研究只采样了这个系统的很小一部分,通常只关注单一模式或空间尺度。非侵入性脑活动记录(如fMRI和M/EEG)仍然是特定宏观尺度上的测量。尽管这些数据高度多变量,但它们仍只捕捉了疾病基础过程中有限的一瞥。
此外,这些测量通常只是个体生命周期中的快照。即使有纵向数据可用,检测有意义的差异仍然极具挑战性。当发现差异时,由于在此组织层次上存在的多重性,解释它们通常是一个不适定问题。
大量可能的分析方法进一步使情况复杂化。通过足够的预处理选择、连通性指标、机器学习流程和统计方法,很容易生成难以重现或解释的发现。这就是为什么我们主张更多基于理论和模型的分析,而非纯粹的数据驱动探索。
还有一些实际考虑因素。先进的神经影像学方法如MEG和fMRI成本高昂、计算要求高,通常需要大量调整和专业知识。如果复杂分析对临床医生来说过于耗时或难以理解和自信使用,那么它们不太可能成为常规临床工具。
那么我们应该鼓励什么样的方法?
我们认为生物标志物发现需要更广泛、更个体化的框架。与其寻找单一的"神奇"生物标志物,我们可能需要结合遗传学、神经递质测量、影像学、电生理学、行为和其他测量的多模态方法。复杂的脑部疾病不可能仅用一个特征来合理地简化。
我们也认为纵向数据至关重要。将患者与其过去的状态进行比较对于取得任何进展都是必要的。疾病进展通常是动态展开的,这些轨迹可能比静态快照携带更有信息量的信号。
同时,患者可能不属于一个统一的疾病类别,而是属于生物学子群或"解决方案岛屿"。即使目前接受相同诊断,共享相似轨迹或多模态特征的个体可能会形成具有临床意义的亚型。
最后,我们倡导机制性和可解释的人工智能方法。人工智能系统不应仅仅输出分类结果;它们应该帮助解释为何做出某种预测,并理想地提供对涉及机制的洞察。在临床神经科学中,仅黑箱准确度可能不足以满足需求。需要的是可解释的、基于生物学的模型,它们能够连接脑组织的不同尺度并指导有意义的生物标志物发现。
如今,许多在线临床数据存储库可供使用,它们吸引人工智能/机器学习专家参与令人兴奋的数据分析(分类)挑战。事实证明,大多数存储库不包含纵向数据。此外,关于脑活动、化学、连通性和结构的多模态数据通常是从不同受试者而非同一受试者收集的。我们认为此类存储库用处不大。因此,我们的观点也隐含地为选择合适的在线数据库提供了指导。
最终,我们的观点并非源于单一成功结果,而是源于在处理脑数据时反复遇到的困难和局限。在许多方面,本文是对重新考虑当前生物标志物研究基础假设的邀请——并鼓励更广泛、更可解释、更以个体动态为中心的方法。当然,这是一条非常困难的道路——但我们不应继续在最终注定失败的更简单方法上浪费时间。
【全文结束】

