摘要
背景
神经记录捕获了沿痴呆连续体的关键病理生理过程。然而,不同医疗中心在记录技术和方案上的差异限制了其可推广性和诊断能力,阻碍了临床应用。本研究提出一种计算方法,即使在临床流程完全不同的情况下,也能实现跨中心分类。
方法
我们利用数字孪生模型推导数字生物标志物,将神经退行机制与多种记录模态下的神经活动变化联系起来。我们通过在两个独立诊所对轻度认知障碍(MCI)和健康受试者进行跨中心分类,测试了数字生物标志物的可推广性。这两个数据集采用了不同的记录技术(脑电图EEG和脑磁图MEG)、预处理方法、招募标准和诊断指南。我们采用迁移学习方法,使用一个诊所推导出的数字生物标志物来分类另一个诊所的患者,反之亦然。
结果
在两个独立数据集的MCI与健康分类中,数字生物标志物的表现优于标准生物标志物(EEG数据集为83%对58%,MEG数据集为75%对68%)。此外,它们实现了准确且一致的跨中心分类(准确率为77-78%),而标准生物标志物在泛化尝试中表现不佳(56-65%)。另外,数字生物标志物能够可靠地跨诊所预测整体认知状态( p < 0.01),而标准生物标志物则无相关性。
结论
数字生物标志物能够在不同记录技术和数据集之间泛化,实现患者状况的跨模态和跨中心分类。这些生物标志物为患者特异性神经退行提供了稳健的测量方法,将神经记录异常映射到潜在结构变化的共同框架中。两个数据集之间的巨大差异支持了该方法在高度跨中心变异情况下的适用性。
简明语言总结
认知能力病理性下降的人会丧失记忆、推理和沟通能力,发展为痴呆等疾病。研究人员已探索使用非侵入性方法记录大脑活动,以确定这些方法是否可用于识别认知能力病理性下降的人群。理想情况下,这些方法应需要最少的设备并减少患者不适,但它们的结果在不同诊所之间往往差异很大。我们使用称为"数字脑孪生"的患者特异性计算脑模型,寻找认知能力病理性下降的可能数字标志物。我们评估了这些标志物是否可用于在不同诊所的两组人群中诊断临床认知能力病理性下降。结果表明,数字标志物在不同临床环境和记录方法中具有良好的泛化能力。它们可能比目前使用的替代方案提供更好的认知能力病理性下降指标,从而改善对认知能力病理性下降人群的识别。
引言
前痴呆状态的功能表征是支持早期认知下降诊断和理解其病理生理学的基本步骤。非侵入性记录方法结合计算技术因其高时间分辨率和减少患者不适而成为这一任务的有希望候选者。尽管许多研究探索了非侵入性记录和机器学习方法在痴呆分类中的组合,但这种方法最终未能达到临床阶段。主要障碍包括这些方法的可解释性和可重复性不足,以及泛化能力差,因为模型通常在单中心数据集上训练。
预测每位患者的临床演变需要评估个体病理生理过程的状态。因此,不能仅依赖数据特征,因为它们本质上只能提供相关性关联。数字孪生,即脑活动的个性化模型,已被提出以克服这一限制,因为它们封装了有关疾病演变的先前病理生理学知识,并利用这些知识预测个体情况。然而,使用数字孪生推导病理性状况生物标志物的尝试很少见。
在此,我们使用数字孪生作为一种生理学信息丰富的方式,整合不同模态和临床中心的数据集。我们采用了先前验证过的数字阿尔茨海默病诊断(DADD)模型,该模型在不同程度的痴呆严重程度下复制皮层活动,以推导代表轻度认知障碍(MCI)状况的患者特异性连接性和突触退化数字生物标志物。这里,"数字生物标志物"指的是从非侵入性记录中估计的模型衍生神经退行参数。
数字生物标志物在迁移学习方法中用于跨两个独立诊所的非重叠队列对MCI患者和健康受试者进行分类。两个队列中的数据采集采用了不同的记录技术、预处理和后处理范式、招募标准和诊断指南。这使我们能够测试我们的方法在存在高度跨中心变异情况下的多中心分析能力。这些数字生物标志物的分类性能与标准电生理生物标志物(如功率谱密度(PSD)和功能连接(FC))进行了比较。数字生物标志物实现了准确的跨模态和跨中心分类,优于标准电生理生物标志物,为临床应用铺平了道路。
方法
参与者招募(数据集1)
总共招募了44名被诊断为轻度认知障碍的患者(16名男性和28名女性;平均年龄73.88±8.32岁;平均教育年限10.14±3.97年),他们来自意大利佛罗伦萨的Careggi大学医院。参与者被纳入PREVIEW项目(临床试验编号:NCT05569083),这是一项专注于前痴呆形式的纵向研究。认知类别的分类基于广泛的临床和神经心理学评估,遵循NIA-AA诊断轻度认知障碍的标准。纳入标准见补充材料"数据集1纳入标准"段落。还招募了17名对照组参与者(10名男性和7名女性)。MCI和对照组参与者在年龄(对照组65.19±4.42岁,U = 123.0,p = 0.00001,Mann-Whitney检验)或教育年限(13.95±4.03年,U = 576.0,p = 0.001,Mann-Whitney检验)方面未匹配。我们通过评估年龄和教育水平与用于分类任务和数字生物标志物推导的标准脑电图和脑磁图生物标志物之间的相关性,确保这些差异不会对结果构成混杂因素。这些相关性分析未发现统计学意义(结果见补充表1)。
数据集1的记录使用脑电图(EEG)获得,无源重建。招募和脑电图记录遵循Careggi大学医院人类实验委员会的赫尔辛基宣言和指南。该研究获得了当地机构审查委员会的批准(Careggi大学医院,参考编号:15691oss),所有患者均提供了知情同意。
参与者招募(数据集2)
总共招募了32名被诊断为遗忘型轻度认知障碍(aMCI)的患者(18名男性和14名女性;21名单领域aMCI和11名多领域aMCI;平均年龄71.31±6.83岁;平均教育年限10.54±4.33年),他们来自意大利那不勒斯Hermitage Capodimonte诊所的认知和记忆障碍中心。所有参与者均为右撇子意大利语母语者,MCI诊断遵循国家老龄化研究所-阿尔茨海默病协会的标准。纳入标准见补充材料"数据集2纳入标准"段落。还招募了32名对照组参与者(19名男性和13名女性),在年龄(69.9±5.61岁)和教育年限(12.96±4.56年)方面匹配。
数据集2的记录使用带有源重建的脑磁图(MEG)获得。对于所有MCI患者和27/32名对照组,均获得了源重建的MEG数据和神经心理学评估数据,并纳入本研究。研究方案获得了"Comitato Etico Campania Centro"伦理委员会的批准(方案编号:93 C.E./Reg. n.14-17OSS),所有参与者均按照赫尔辛基宣言以书面形式提供知情同意。
信号记录和预处理(数据集1)
脑电图数据从符合研究纳入标准的受试者中收集。脑电图记录在受试者舒适坐姿、闭眼状态下进行。信号使用64通道Galileo-NT系统(E.B. Neuro S.p.a.)收集,传感器拓扑遵循扩展10/20系统。单极信号以512 Hz的采样率记录,在脑电图采集过程中监测的电极阻抗保持在7-10 kOhm范围内。阻抗超出7-10 kOhm范围的信号部分被丢弃。
脑电图预处理流程在MATLAB上使用商业EEGLAB工具箱实现,遵循PREP流程,随后进行独立成分分析(ICA)伪迹拒绝。包括:(i)使用巴特沃斯滤波器在0.5-45 Hz范围内进行带通滤波,(ii)识别并随后去除噪声通道,(iii)平均重新参考,(iv)高振幅伪迹的视觉拒绝,以及(v)基于ICA的伪迹成分检测和消除。每个步骤的详细信息见补充材料"信号预处理(数据集1)"段落。
信号记录和预处理(数据集2)
数据使用带有154个磁力计和9个参考传感器的脑磁图(MEG)系统在磁屏蔽室(ATB, Biomag, ULM, Germany)中收集,以最小化外部噪声。头盔下的头部位置由Fastrack(Polhemus)定义,数字化四个解剖标志(鼻根、左右前耳点和顶点)以及附着在受试者头部的四个参考线圈的位置。每位受试者进行了两次记录(每次3.5分钟),中间有1分钟的休息时间,在闭眼静息状态下进行。还记录了心脏活动和眼球运动。预处理与Liparoti等人描述的类似。源重建基于Nolte描述的容积传导模型,使用自动解剖标记(AAL)图谱。该程序见补充材料"信号预处理(数据集2)"段落。
电生理指标
对于两个数据集,我们提取了标准频带中的相对功率谱密度(PSD)值(δ波:0-4 Hz,θ波:4-8 Hz,α波:8-13 Hz,β波:13-30 Hz,γ波:30-45 Hz)。功能连接(FC)使用标准皮尔逊相关或幅度包络相关(对容积传导效应极其稳健)进行评估,在数据集合并后选择信息量最大的一种(标准皮尔逊相关)。对于这两个指标,我们仅考虑显著的相关值(p < 0.05)。功能连接在标准频带内和整个频带范围(0.5-45 Hz,因为信号在此频率区间内进行了带通滤波)内计算。我们在两个数据集中使用相同的技术计算电生理指标,但分别针对数据集1的脑电图(在传感器空间)和数据集2的脑磁图(在源空间)。为了量化预处理技术的作用,在补充材料"预处理与原始信号比较(两个数据集)"段落中,我们还报告了基于从两个数据集原始信号(即无预处理)导出的电生理指标的统计分析和数字生物标志物推导结果。
DADD模型和模拟信号
本研究中使用的DADD数字孪生模型已在我们小组先前的出版物中详细描述。简而言之,它使用The Virtual Brain(TVB)平台将大脑皮层表示为76个相互作用区域的网络。每个感兴趣区域(ROI)内的神经活动使用基于改进的Jansen-Rit神经质量模型的平均场近似进行模拟。这些ROI通过从人类追踪数据导出的高保真结构连接矩阵连接。
模型分区中的ROI数量(n = 76)与脑电图传感器(n = 65)和用于脑磁图信号源重建的功能图谱中的ROI(n = 90)之间存在明显差异。这种差异源于结构连接数据的选择,它独立于用于源重建的功能图谱,当然也独立于实验记录中使用的脑电图帽。这使我们能够测试模型灵活性的另一个方面,即其桥接不同分区方案和记录模态(例如传感器空间中的脑电图和源空间中的脑磁图)的能力。
因此,模型输出由模拟每个ROI在不同结构神经退行水平下神经动力学的时间序列组成。在模型中,神经退行由影响突触传递和连接的三个参数建模。
突触退行由lp(来自局部参数,因为它影响局部活动)参数控制,公式为:
$$,\begin{array}{cc} & \tau_{i}\to \tau_{i}^{HC}+{lp}\times \left(\tau_{i}^{\max }-\tau_{i}^{HC}\right)\ , & \tau_{e}\to \tau_{e}^{HC}+{lp}\times \left(\tau_{e}^{\min }-\tau_{e}^{HC}\right),0 < {lp} < 1\end{array}$$
(1)
连接退行由cp和np参数描述,公式为:
$${C}{\mbox{weight}}\to \left{\begin{array}{cc}C{\mbox{weight}}^{HC}-{cp}\times C_{\mbox{weight}}^{\max }, \hfill & \mbox{if} , C_{\mbox{length}} > C_{length}^{th},\ C_{\mbox{weight}}^{HC}+{np}\times {cp}\times C_{\mbox{weight}}^{\max }, & \mbox{if} , C_{\mbox{length}} < C_{\mbox{length}}^{th}\end{array},0 < {cp} < 1\right.$$
(2)
突触退行参数(lp)仅影响神经质量的局部动力学,而连接退行(cp)和神经可塑性(np)影响结构连接矩阵。从生物物理学角度看,lp反映了由于早期Aβ沉积导致的皮层低抑制和过度兴奋,主要发生在对应于早期Braak阶段的区域,主要是额叶和颞叶区域。cp参数描绘了白质萎缩。np参数描述了连接重布线的神经可塑性效应。方程中的值源自生物物理约束,可在我们小组先前的工作中查阅。
此外,我们考虑了连接和突触退行参数的平方和,称为总退行参数,公式为:
$$,{Total; Degeneration}=\sqrt{{cp}^{2}+{lp}^{2}}$$
(3)
统计和可重复性
组间比较使用Mann-Whitney U检验进行,当正态性和等方差假设不满足时,该检验适用于比较两个独立组。使用应用于混淆矩阵的McNemar检验对分类性能进行统计比较(见补充材料"机器学习流程、分类和交叉分类"段落)。
离群值定义为距离最近数据点超过3$\sigma$的数据点,其中$\sigma$是样本的标准差。
使用Scipy的linregress命令评估标准和数字生物标志物与MMSE分数之间的相关性。在分析前对MMSE分数进行了年龄校正。校正方法是计算年龄和MMSE之间的回归线斜率${S}_{{Age}/{MMSE}}$,然后根据公式向MMSE分数添加加权年龄值:
$$,{Corrected; MMSE}={MMSE}+{abs}({S}_{{Age}/{MMSE}})\times {Age}$$
(4)
其中${abs}$表示绝对值。教育水平在两个数据集中与MMSE均无显著关系(r = −0.04, p = 0.81),因此从MMSE分数校正中排除。所有计算和数据分析流程均在Python中实现,使用Virtual Brain软件进行模拟,并使用SciPy、NumPy和Pandas等标准Python包进行分析。机器学习流程使用Scikit-Learn实现,并在补充材料"机器学习流程(分类和交叉分类)"中报告。
结果
我们分析了两个不同的数据集(图1A)。第一个数据集包括17名健康对照(CTR)受试者和44名MCI患者,他们在意大利佛罗伦萨Careggi医院神经科接受静息态脑电图(EEG)检查。
图1:使用数字生物标志物进行轻度认知障碍的跨模态和跨中心分类。
A 考虑了来自两个不同数据集和多模态记录技术的参与者。两个数据集都包括健康对照(CTR)和轻度认知障碍(MCI)患者,从两个独立诊所按不同标准招募。两个数据集采用不同的记录技术,数据集1使用EEG,数据集2使用带有源重建的MEG。 B 为每位患者推导生物标志物,使用电生理记录的标准分析或个性化脑模型(数字生物标志物)。 C 通过将它们用作健康和MCI状况之间的分类特征来评估生物标志物性能。通过使用在数据集1上训练的分类器对数据集2的患者进行分类(反之亦然),利用迁移学习方法还评估了此类分类的可推广性。然后比较标准和数字生物标志物的性能。
第二个数据集包括27名CTR受试者和32名遗忘型MCI患者,他们在意大利那不勒斯Hermitage医院接受了脑磁图(MEG)检查。两个数据集中的患者在生物性别构成(卡方检验=2.22, p = 0.14)、年龄(Mann-Whitney U检验=479.0, p = 0.068)和教育水平(U = 628.5, p = 0.89)方面无统计学差异。我们评估了数字生物标志物与标准生物标志物的跨模态和跨中心分类性能(图1B)。使用迁移学习方法,我们在一个数据集的患者上训练机器学习分类器,并测试其对另一个数据集患者的分类能力(图1C)。
数字生物标志物在两个数据集中区分诊断类别
脑电图和脑磁图信号在统计分析前进行了预处理(见方法,"信号记录和预处理"段落)。我们从两个数据集的记录中提取了相同的标准化生物标志物(见"电生理指标"段落)。然后我们使用标准生物标志物,遵循已在脑电图数据上验证过的程序,推导数字生物标志物(见补充材料,"个性化数字生物标志物的确定"段落)。在合并两个数据集后,我们计算了患者临床状况(CTR vs MCI)的分类变量与标准和数字生物标志物之间的互信息(见方法,"互信息"段落)。我们确定β/θ PSD比率为最具信息量的标准生物标志物(MI = 0.21 [0.04, 0.32]),而最具信息量的数字生物标志物被发现是突触退行和连接退行参数的平方和(总退行参数,MI = 0.21 [0.09, 0.24])。
随后,我们运行统计分析,比较两个数据集中最具信息量的标准和数字生物标志物在不同条件下的值。对于数据集1,最具信息量的标准生物标志物(β/θ比)在两个条件之间未显示显著差异(U = 502, p = 0.054, d = 0.2,图2A)。然而,总参数数字生物标志物在组间呈现显著差异(U = 196, p = 0.010, d = −0.9)。对于数据集2,β/θ比在组间确实存在显著差异,但效应大小适中(U = 622, p = 0.004, d = 0.5)。总退行参数也具有显著性,效应大小更大(U = 257, p = 0.006, d = −0.8,图2B)。
图2:数字生物标志物区分临床状况并预测患者的总体认知状态。
A 在组间比较最具信息量的标准生物标志物和最具信息量的数字生物标志物(数据集1,17名健康对照和44名MCI)。仅总退行在组间显示出显著差异。 B 在组间比较最具信息量的标准生物标志物和最具信息量的数字生物标志物(数据集2,27名健康对照和32名MCI)。β/θ PSD比(见正文)在组间显示出显著差异,尽管效应大小适中。总退行显示类似的显著性和更大的效应大小。 C 标准生物标志物与校正MMSE之间未发现显著相关性(β/θ比的相关性最高,r = 0.13, p = 0.15)。 D 突触退行与校正MMSE呈显著负相关(r = −0.27, p = 0.009)。 C 和 D 中报告的值在绘图前进行了归一化。说明:在箱线图中,须线表示1.5倍四分位距,中位数由黑色水平线突出显示。在线性回归图中,阴影区域表示具有置信区间(2.5%-97.5%)的误差带。显著性符号:*表示p < 0.05;**表示p < 0.01,双侧Mann-Whitney检验。
数字生物标志物预测患者的总体认知状态(MMSE)
然后,我们调查了识别的生物标志物(标准和数字)与使用(年龄校正)简易精神状态检查(MMSE)测量的MCI患者的总体认知状态之间的关系,合并了两个数据集。这是通过在候选生物标志物(标准或数字)与针对患者年龄校正的MMSE分数之间进行线性回归分析完成的(见方法,"统计和可重复性"段落)。值得注意的是,虽然标准生物标志物未发现显著相关性(β/θ比的相关性最高,r = 0.13, p = 0.15,见图2C),但突触退行数字生物标志物与校正MMSE呈显著负相关(r = −0.27, p = 0.009,图2D)。换句话说,模型预测的更大突触损伤与临床评估期间更差的总体认知表现相关。我们通过自助法对合并数据集进行100次重采样,分析r值的分布,测试了这一预测的稳健性(补充图1)。数字生物标志物线性回归的r值呈现双峰性(Hartigan's dip检验,p < 0.001),反映了两个数据集中患者的多样性。标准生物标志物的线性回归r值未观察到双峰性。通过分别对两个数据集运行校正MMSE与标准和数字生物标志物之间的相同线性回归分析,进一步证实了这种双峰性(补充图2)。在数据集1中,标准生物标志物与校正MMSE之间未发现显著相关性(α波功率的相关性最高,r = 0.10, p = 0.28),而连接退行参数显示显著相关(r = −0.29, p = 0.036)。在数据集2中,没有标准生物标志物能显著预测总体认知状态(β/θ比的相关性最高,r = 0.14, p = 0.23)。在数字生物标志物中,突触退行参数强烈预测MCI患者的校正MMSE(r = −0.47, p = 0.004)。
数字生物标志物在机构内和跨机构环境中对患者进行分类,始终优于标准生物标志物
接下来,我们评估了标准和数字生物标志物在区分健康对照与MCI患者方面的表现。我们使用嵌套交叉验证方法评估了标准和数字生物标志物的分类性能(见补充材料,"机器学习流程(分类和交叉分类)"段落)。我们在训练集中加入了特征选择程序,以识别两组生物标志物的最具信息量特征。然后我们比较了分类性能。标准生物标志物的分类特征在补充材料"互信息"段落中报告,而所有数字生物标志物都被视为数字生物标志物集中的潜在特征。测试了多种机器学习算法(见补充材料,"机器学习流程(分类和交叉分类)"段落),选择在所有分类中获得最佳性能的算法(见补充表2)。在数据集1中,数字生物标志物在平均准确率方面优于标准生物标志物(0.83 ± 0.07对0.58 ± 0.04),以及受试者工作特征(ROC)曲线下面积(AUC,0.79对0.62,图3A)。对两个分类器性能的统计检验确认了数字生物标志物的优越性(p = 0.006,McNemar检验)。数据集2也获得了类似结果,数字生物标志物显示出更高的准确率0.75 ± 0.03对0.68 ± 0.04)和AUC(0.77对0.69,图3B),尽管分类器之间的差异在统计学上不显著(p = 0.22,McNemar检验)。这些发现表明,数字生物标志物在区分健康和MCI患者方面更有效且更具泛化性,数字化导致从脑磁图或脑电图开始的分类性能相似(而标准分类在脑磁图方面明显更优)。
图3:数字生物标志物实现轻度认知障碍的稳健跨中心分类。
A 数据集1中健康-MCI分类的生物标志物性能。基于数字模型的生物标志物在平均准确率(左,p = 0.006)和ROC曲线下面积(右)方面表现出更高的值。 B 数据集2中健康-MCI分类的生物标志物性能。对于数据集2,基于数字模型的生物标志物在平均准确率(左)和ROC曲线下面积(右)方面也优于标准生物标志物,尽管没有统计学意义(p = 0.22)。 C 基于标准和数字生物标志物的跨中心分类性能(在数据集1上训练,在数据集2上测试)。与标准生物标志物相比,数字生物标志物具有更高的准确率(左,p = 0.0001)和更高的ROC曲线下面积(右),而标准生物标志物表现出略高于随机水平的性能。 D 基于标准和数字生物标志物的跨中心分类性能(在数据集2上训练,在数据集1上测试)。在这种情况下,数字生物标志物也表现出更高的准确率(左,p = 0.031)和略高的ROC曲线下面积(右)。说明:误差线表示标准差值,而条形高度表示平均值(100次自助迭代)。所有面板的平均值和标准差均在100次自助迭代后计算。显著性符号:*表示p < 0.05;**表示p < 0.01,双侧McNemar检验。
最后,我们测试了标准和数字生物标志物在支持患者交叉分类方面的表现(见补充材料,"机器学习流程(分类和交叉分类)"部分)。
对于从数据集1到数据集2的交叉分类,与标准生物标志物相比,数字生物标志物实现了更高的准确率(0.78 ± 0.03对0.56 ± 0.04)和AUC(0.74对0.53,图3C)。McNemar检验确认了优越性能(p = 0.0001)。类似地,对于从数据集2到数据集1的交叉分类,数字生物标志物表现出优越性能(p = 0.031,McNemar检验),具有更高的准确率(0.77 ± 0.03对0.65 ± 0.06)和AUC(0.76对0.70,图3D)。
讨论
总体而言,数字生物标志物表现出强大的交叉分类能力,而标准生物标志物则表现不佳。这些发现标志着向将非侵入性记录和计算方法整合到临床实践迈出了重要一步。此外,通过重建各种功能和动态变化背后的结构机制,数字生物标志物在不同记录类型中表现出极大的泛化能力。
DADD模型通过纳入描述痴呆进展相关多尺度病理机制的参数,复制了不同神经退行水平下的神经活动。即,突触退行参数捕获了由于早期淀粉样β沉积导致的过度兴奋效应。连接退行参数描绘了由于轴突损伤导致的白质萎缩。神经可塑性参数捕获了大脑为应对连接损伤而进行的连接重布线。这些参数能够在两个数据集中以一致的性能区分健康和MCI患者,优于脑磁图和脑电图,并将两种记录技术中观察到的变化映射到一个共同的框架中。
可重复性是临床研究的关键要求,而数字生物标志物能够使用相同的分类技术在采用不同纳入标准、记录模态、预处理和后处理技术的不同数据集上获得一致的结果。对于标准生物标志物而言,这种可重复性是不可能的,它们在两个不同数据集上取得了可变的结果,总体性能较低,与使用类似方法进行的多中心研究一致。
如预期,脑磁图数据相比脑电图提供了更好的分类性能。然而,当使用数字生物标志物进行分类时,数据集之间的这种差异消失了。这表明数字生物标志物的提取也可能用于"清理"噪声更大的数据(如脑电图),将分类水平提高到可与黄金标准(脑磁图)相媲美的程度。鉴于脑电图相对低成本和广泛可用,而脑磁图通常仅在大型研究机构中可用,这可能具有重要的实际意义。
此外,虽然没有标准生物标志物与患者的认知状态相关,但数字生物标志物以高显著性预测了校正MMSE分数,将突触退行与认知下降严重程度联系起来。值得注意的是,在数据集1中,连接退行参数(cp)被发现与校正MMSE呈负相关。该队列中的患者是无特定类型的MCI。cp参数捕获了断开连接效应,这已被广泛记录为与由于年龄或疾病导致的认知下降相关。相反,在数据集2中,突触退行被发现与校正MMSE呈强烈负相关。数据集2中的患者是遗忘型MCI,与非遗忘型MCI相比,已知其颞叶退化程度更高,与淀粉样蛋白沉积相关。关键的是,突触退行参数有选择地改变前额叶和颞叶的突触传递。因此,数字生物标志物不仅与认知状态相关,还提供了对导致MCI患者认知下降的宏观和微观结构变化的可解释预测。
在之前的一项工作中,我们已经尝试在数据集1的患者上使用标准生物标志物进行健康对照-MCI分类,与这里讨论的结果相比获得了更好的结果。该研究中用于分类的脑电图生物标志物是通过为数据集1量身定制的特征选择过程特别选择的。然而,需要共同的电生理指标来表征两个数据集导致该数据集中分类性能显著下降,再次突显了标准生物标志物的泛化能力不足。
这一限制在机构内和跨数据集分类中都很明显。在机构内分类中,数据集2显示的平均准确率(0.68)高于数据集1(0.58),这可能是由于脑电图(数据集1)和脑磁图(数据集2)之间的分类能力差异,如上所述。对于跨数据集分类,将分类从数据集2转移到数据集1实现了比相反方向更高的平均准确率(数据集1 → 2为0.56)。相比之下,数字生物标志物提供了更一致的结果,在机构内分类平均准确率(数据集1为0.83,数据集2为0.75)和跨数据集分类平均准确率(数据集1 → 2为0.78,数据集2 → 1为0.77)方面表现相似。
在个性化医学中使用计算模型是一个新兴领域,其在诊断和预后方面的应用仍相对未被探索——特别是在痴呆等领域。一个值得注意的例外是Triebkorn等人的研究,其中使用计算脑模型来改善健康对照、轻度认知障碍(MCI)和阿尔茨海默病患者之间的分类,使F1分数提高了0.10。
另一个有希望的患者分类途径涉及使用深度神经网络。几项研究利用了这种方法,特别是Fouladi等人报告使用脑电图数据和卷积神经网络对健康个体与MCI或AD患者进行分类的准确率达到92%。Sibilano等人解决了更早阶段的问题,报告区分主觉认知下降(SCD)与MCI的F1分数为0.76,在涉及健康、SCD和MCI个体的多类分类任务中为0.54。
虽然深度学习方法可以实现高准确率,但它们通常缺乏可解释性并且需要大型数据集——这在临床环境中可能是一个障碍,因为并非总是可以进行大量数据收集。此外,很少尝试使用这些技术进行跨中心分类,Watanabe等人的研究是一个显著的例外,但该研究专注于对不同痴呆形式进行分类,结果各异(AUC从0.508到0.920不等)。
没有研究曾尝试对从非侵入性记录或计算模型中推导出的生物标志物进行跨泛化,以对认知下降患者进行分类。Watanabe等人的最新研究识别了可以从脑电图记录中区分不同痴呆类型的生物标志物,招募了来自三个不同中心的患者。然而,该模型是在明显的痴呆病例上训练的,并未通过交叉分类进行泛化。
值得注意的是,本研究存在几个局限性。虽然我们的模型有效地捕捉了与认知下降进展相关的关键神经生理机制,但重要的是要认识到认知下降是一种受多种生物、心理和环境因素影响的多面性状况——其中许多因素无法在计算框架内完全表示。我们的模型目前侧重于捕捉前临床或早期临床状况(如主觉认知下降和MCI)下潜在的早期神经退行过程。模型的后续迭代应旨在适应更广泛的状况,包括明显的痴呆状态,如阿尔茨海默病。此外,我们的研究旨在评估模型推导参数在从不同医疗机构获取的两个独立队列中的稳健性。这些队列不仅在记录方式(脑电图vs脑磁图)上有所不同,而且在预处理流程、采集协议和招募标准上也存在差异。这使我们能够测试模型在存在各种差异的数据集之间泛化的能力。虽然模型参数始终优于标准生物标志物(标准生物标志物在队列之间表现出显著的变异性),但中心之间的众多差异引入了潜在的混杂因素,使解释为什么某些标准指标未能泛化变得复杂。重要的是,尽管我们的工作利用了两个不同的数据集,但在此上下文中"跨中心"一词指的是该模型在不同模态和站点上的应用,而不是使用相同模态在不同中心独立记录的多个数据集。在后者框架中,多中心设计将需要例如在不同站点独立记录的两个脑电图和两个脑磁图数据集上使用相同的方法。
确保候选生物标志物能够支持准确的交叉分类对于计算和机器学习模型的临床应用至关重要。我们的模型提供的数字生物标志物表现出高交叉分类准确率,提供了稳健且可解释的分类。两个数据集采用了不同的招募标准和多模态记录技术,这再次凸显了数字生物标志物在现实临床环境中的潜在作用。我们的工作为将非侵入性记录和计算模型转化为临床实践铺平了道路。
数据可用性
图2中报告的数据可以.csv格式在补充数据1-4中找到。匿名人口统计数据(包括MMSE和年龄)可根据要求从alberto.mazzoni@santannapisa.it(数据集1,脑电图)和pierpaolo.sorrentino@univ-amu.fr(数据集2,脑磁图)处由合格的学术研究者提供。
代码可用性
数字孪生模拟和数字生物标志物推导的代码可在
致谢
L.G.A.、M.L.和A.M.得到了#NEXTGENERATIONEU (NGEU)的部分支持,并由大学和研究部(MUR)、国家复苏和韧性计划(NRRP)资助,项目EBRAINS-Italy (IR0000011) - 欧洲脑研究基础设施-意大利(DN. 101 16.06.2022),项目MNESYS (PE0000006) – 神经系统健康和疾病多尺度综合研究方法(DN. 1553 11.10.2022)。R.M.、G.S.、E.T.L.、P.S.得到了经济发展部的支持和资助;工业发展合同"制药和诊断"(CDS 000606);欧洲联盟"NextGenerationEU"(PNRR投资3.1.M4. C2)。L.G.A.、M.L.、V.M.、G.G.、A.G.、V.B.和A.M.部分由托斯卡纳大区资助 - 预测主觉认知下降向阿尔茨海默病的演变 - PREVIEW CUP.D18D20001300002。
【全文结束】


