代谢组学生物标志物与冠状动脉疾病患者次要不良心血管事件存在独立关联Metabolomic Biomarkers Are Independently Associated With Secondary Adverse Cardiovascular Events in Patients With Coronary Artery Disease | Journal of the American Heart Association

环球医讯 / 心脑血管来源:www.ahajournals.org美国 - 英语2025-10-11 05:44:09 - 阅读时长15分钟 - 7405字
本研究评估了血浆代谢物作为冠状动脉疾病患者次要主要不良心血管事件发展的新型生物标志物及风险预测的潜力。研究分析了10,175名具有冠状动脉疾病的UK Biobank参与者数据,通过核磁共振测量了249种代谢物。研究使用交叉验证的弹性网络回归模型筛选出26种代谢物构建代谢组学风险评分。结果显示,代谢组学风险评分最高的20%参与者相较于最低的20%,发生主要不良心血管事件和心血管死亡的风险显著增加,即使调整了传统风险因素。将代谢组学风险评分加入传统风险因素模型可适度改善10年风险预测能力。研究表明,代谢组学生物标志物与冠状动脉疾病患者的主要不良心血管事件,特别是心血管死亡存在独立关联,为高风险人群疾病发展的生物学通路提供了宝贵见解,对心血管疾病的二级预防具有重要临床意义。
冠状动脉疾病次要不良心血管事件代谢组学生物标志物代谢组学风险评分MACE风险预测心血管健康传统风险因素SMART2模型
代谢组学生物标志物与冠状动脉疾病患者次要不良心血管事件存在独立关联

主要不良心血管事件(MACEs)是冠状动脉疾病(CAD)患者发病和死亡的主要原因,平均15年随访期间的估计发生率在30%至40%之间。传统风险因素的有效干预和指南指导的抗血栓治疗在降低这一高风险人群的MACEs方面发挥了关键作用。然而,由于该人群中风险的异质性和驱动次要MACE发展的复杂多因素机制,风险评估仍然具有挑战性。尽管取得了显著进展,许多患者即使传统心血管风险因素水平较低,仍会经历复发性MACEs。这凸显了识别新型生物标志物以增强风险预测并为次要MACEs提供早期个性化预防策略的必要性。

代谢组学分析是一种用于测量体液中小分子(代谢物)的新兴技术,提供了识别遗传和环境因素综合影响的独特机会。这种分析方法对于冠状动脉疾病患者中的次要MACEs尤其相关,因为代谢因素之间的相互作用可能表明疾病进展的关键驱动因素。尽管其具有潜力,但血浆代谢物(包括从多种代谢物衍生的代谢组学风险评分[MRSs])与CAD患者MACE发展的关系仅在少数研究中被探索。然而,已发表的报告受到代谢组学生物标志物数量少、样本量小或随访时间短的限制。此外,MRS对这一高风险人群中MACE风险预测的贡献尚不明确。鉴于血浆代谢物比其他组学(基因组学、转录组学和蛋白质组学)更接近疾病表型,并且可以从单一生物样本测量,而不像许多传统心血管疾病(CVD)风险因素,推导MRS是一种识别与MACEs相关的中间代谢物的有希望的方法。这种方法可以实现更精确的监测以及为这一高风险群体开发新的诊断和治疗策略。

本研究旨在评估循环代谢物作为CAD患者MACE发展和风险预测的新型生物标志物的潜力。使用机器学习方法,我们构建了MRS并研究了其与中年人群CAD患者MACEs的关联。此外,我们评估了将MRS添加到更新的动脉疾病次级表现(SMART2)模型时的增量预测价值,该模型是一种基于传统风险因素的模型,旨在估计已确诊CVD个体的10年MACE风险。

方法

数据可用性

本研究使用来自UKB(UK Biobank;申请ID: 34031)的数据,这是一个用于公共卫生研究的开放获取资源。所有支持数据,包括统计/分析代码,均可在合理请求下获得。

研究人群和结果定义

研究人群来自UKB,这是一项涉及40至72岁50多万名参与者的大型前瞻性研究,招募时间为2006年至2010年。本研究包括10,175名在基线时(1)接受了血浆样本的核磁共振(NMR)代谢分析,提供249种代谢组学生物标志物数据,以及(2)有CAD(所有亚型)病史的参与者,使用《国际疾病分类第九版(ICD-9)》和《第十版修订版(ICD-10)》以及《人口普查和调查干预和程序分类(OPCS-4)》代码进行识别。

本研究的主要终点是次要MACE,定义为在已有CAD的参与者中基线后首次发生非致死性心肌梗死(MI)、缺血性中风或心血管死亡的复合事件。个体MACEs在本研究中用作次要终点。事件使用ICD-9、ICD-10和OPCS-4代码进行识别。随访时间定义为从入组到首次复发MACE、死亡或2023年9月随访结束(数据访问的最后一天)的期间。

代谢组学分析

代谢生物标志物定量是在约275,000名随机选择的UKB参与者的基线EDTA血浆样本上进行的,使用高通量靶向NMR平台(Nightingale Health Plc)。该平台同时量化每份样本中的249种代谢生物标志物,包括168种直接测量和81种衍生比率,涵盖氨基酸、脂肪酸、脂质、糖酵解相关代谢物和酮体。大多数生物标志物以绝对浓度单位(mmol/L)报告。

代谢组学风险评分的构建

包括在基线时有已确诊CAD并接受代谢组学分析的参与者的研究人群被随机分为两组:70%形成训练队列用于特征选择和用于构建MRS的β系数(权重)估计,而剩余的30%作为测试队列用于应用和评估MRS。为了确定与次要MACEs最相关的代谢物,使用弹性网络Cox回归模型进行特征选择。该方法整合了最小绝对收缩和选择算子以及岭惩罚,实现有效的变量选择并增强预测性能。

在训练队列(n=7,122)中,使用所有249种代谢组学生物标志物作为预测因子,年龄和性别调整的弹性网络Cox比例风险回归用于次要MACEs作为结果。为弹性网络模型选择最佳α是通过网格搜索方法完成的。生成一系列从0到1的α值,增量为0.1。对于每个α,使用自生成的100个λ值序列构建内部10折交叉验证模型。评估覆盖了指定范围内所有可能的α和λ值组合。基于最小模型误差选择最佳α和λ组合。在至少8个交叉验证模型中出现的代谢组学生物标志物(频率最高)被选用于MRS计算。

然后在训练队列中拟合未惩罚的Fine和Gray竞争风险模型,纳入所有选定的代谢组学生物标志物,以评估其与10年发生次要MACEs的关联(将非CVD死亡视为竞争事件)。简而言之,Fine和Gray模型直接对亚分布风险函数建模,允许在存在竞争风险的情况下估计感兴趣事件的累积发生函数。我们使用Schoenfeld残差评估Fine和Gray竞争风险模型的比例亚分布风险假设。结果表明没有违反比例风险假设。从该模型得到的系数用于通过将代谢组学生物标志物相加(每个都乘以其对应的β系数)在测试队列(n=3,053)中计算加权MRS。

传统风险因素和SMART2风险模型

在本研究中,我们使用更新的SMART2模型的重新拟合版本作为参考模型,这是一个广泛使用的基于传统风险因素的模型,旨在估计已确诊CVD个体的10年MACE风险。用于计算SMART2风险模型的变量包括入组时年龄(岁)、性别、2型糖尿病、当前吸烟、收缩压、非高密度脂蛋白胆固醇(从总胆固醇和高密度脂蛋白胆固醇推导)、C反应蛋白(CRP)、估计肾小球滤过率、首次动脉粥样硬化CVD事件后的年数、心绞痛自报病史、心脏病发作自报病史以及中风自报病史。收缩压(6%)、总胆固醇(5%)、高密度脂蛋白(12%)、CRP(5%)和估计肾小球滤过率(5%)的缺失数据使用多重插补链式方程进行插补。SMART2风险评分的系数使用训练数据集中的Fine和Gray竞争风险模型推导,随后为测试数据集中的参与者计算。

统计分析

使用χ²检验描述总体队列的基线特征,并在训练队列和测试队列之间进行比较;连续变量使用Student t检验。MRS被分为高风险(前20%)、中风险(中间60%)和低风险(后20%)组。使用Fine和Gray竞争风险模型,通过年龄和性别调整的风险比(HRs)与95%置信区间(CIs)评估测试队列中MRS组与次要MACEs(复合和各个组成部分)之间的粗累积发生率曲线。

使用Fine和Gray竞争风险模型,评估测试队列中包含在MRS中的每个标准化(均值居中并按标准差缩放)代谢组学生物标志物与次要MACEs之间的独立关联。为了评估MRS类别与次要MACEs之间的关系,计算了未调整(模型1)和调整后(模型2和3)的HRs,以低MRS组为参考。使用Fine和Gray竞争风险模型评估复合MACE结果,以考虑竞争事件(非CVD死亡)。非致死性MI和缺血性中风的HRs使用Cox比例风险模型估计,而CVD相关死亡的HRs使用Fine和Gray竞争风险模型估计,将非心血管死亡视为竞争事件。此外,我们使用标准化MRS(均值居中并按标准差缩放)值将MRS建模为连续变量。协变量调整依次在两个模型中进行:模型2调整年龄和性别,而模型3进一步调整2型糖尿病状态、吸烟状态、收缩压、非高密度脂蛋白胆固醇、估计肾小球滤过率以及首次动脉粥样硬化心血管疾病事件后的年数。使用Schoenfeld残差评估Fine和Gray竞争风险模型和Cox模型的比例风险假设。结果表明没有违反比例风险假设。使用三次样条回归评估MRS与次要MACEs之间的关联模式。使用0.05的P值阈值评估线性或非线性模式的统计显著性。

通过比较两个模型的区分度和校准来评估MRS预测10年次要MACEs的增量价值:(1)仅SMART2模型和(2)SMART2+MRS模型。使用Harrell的C指数评估模型区分度,MRS的改善定义为模型1和模型2之间C指数的差异(ΔC)。使用自举法估计95%CI。校准通过校准图(预测与观察到的MACE风险的十分位数)进行视觉评估,并通过计算校准斜率进行量化。斜率为1.0表示完美校准,斜率>1.0表示观察到的风险高于预测,斜率<1.0表示观察到的风险低于预测。

结果

总体队列的平均年龄为62.1±6.0岁,包括7,237(71.1%)名男性和2,938(28.9%)名女性。在训练队列中,有5,095(71.5%)名男性和2,027(28.5%)名女性参与者,平均年龄为62±6.0岁。在10年的中位随访时间内,训练队列中有1,144(16.1%)例总MACEs、560(7.9%)例非致死性MI、401(5.6%)例缺血性中风和904(12.7%)例心血管死亡。训练队列中糖尿病和高血压的患病率分别为19.3%和10.5%。训练队列参与者首次动脉粥样硬化CVD事件后的平均间隔为6.5±7.0年。在测试队列中,10年中位随访期间MACEs的发病率低于训练队列(480[15.7%]例总MACEs;171[5.6%]例非致死性MI;95[3.1%]例缺血性中风;以及288[9.4%]例心血管死亡)。测试队列中人口统计学特征、临床特征和传统心血管风险因素负担的分布与训练队列相似。

代谢组学生物标志物与次要MACEs之间的关联

弹性网络Cox比例风险回归模型在训练队列(n=7,122)中确定了26种代谢物用于构建MRS。表2显示了测试队列中26种代谢组学生物标志物与次要MACEs的关联估计。脂肪酸不饱和度与次要MACEs呈统计学显著负相关(HR每1-SD增加:0.78[95% CI,0.63-0.97])。其他三种代谢组学生物标志物,包括葡萄糖、肌酐和糖蛋白乙酰基,与MACEs呈统计学显著正相关。

MRS与次要MACE之间的关联

次要MACEs的发病率,包括复合和各个组成部分,在高MRS(前20%)组中最高,与中风险(中间60%)和低风险组(后20%)相比(图2)。这种关联对复合MACEs和CVD相关死亡最强。与低风险组相比,高MRS组个体在调整年龄和性别后,复合MACEs的风险增加超过3倍(HR,3.08[95% CI,2.31-4.12])。在进一步调整心血管风险因素和临床表型后,风险仍然存在(HR,2.19[95% CI,1.61-2.99])。相比之下,中风险组与低风险组相比,MACE风险没有显示出统计学显著增加。

在连续尺度上,MRS每增加1个标准差,MACEs风险增加35%至50%,即使在调整人口统计学因素(HR,1.54[95% CI,1.43-1.67])、心血管风险因素和临床表型(HR,1.37[95% CI,1.25-1.50])后也是如此。在MACE结果中,MRS与心血管死亡之间的关联最强,高风险组在调整人口统计学和心血管风险因素以及临床表型后,风险比低风险组高3至5倍(模型2:HR,5.26[95% CI,3.45-8.03];模型3:HR,3.69[95% CI,2.35-5.78])。虽然MRS与非致死性MI显著相关,但效应大小低于复合MACEs和CVD死亡。MRS与缺血性中风之间没有观察到统计学显著关联。此外,MRS与次要MACEs之间的关系对复合MACEs和CVD相关死亡基本呈线性,而非致死性MI和缺血性中风显示非线性关联。

MRS对MACE风险预测的性能

通过比较添加MRS到SMART2模型前后模型性能(包括区分度和校准)来检查测试队列中MRS对预测复合MACEs的性能。在将MRS添加到SMART2风险后,Harrel C统计量有适度改善(SMART2的C统计量,0.652[95% CI,0.627-0.677];SMART2+MRS的C统计量,0.664[95% CI,0.639-0.688];ΔC 0.012[95% CI,-0.003至0.025])。两个模型的校准性能表明对10年MACE风险的高估。然而,与仅SMART2模型相比,将MRS添加到SMART2评分中略微改善了校准,如校准斜率所示(0.91[95% CI,0.79-1.03]对比0.88[95% CI,0.74-1.02])。

讨论

在CAD参与者队列中,使用惩罚弹性网络模型从26种代谢组学生物标志物推导的高MRS与10年随访期间复合MACEs、非致死性MI和CVD特异性死亡风险增加相关。值得注意的是,与后20%相比,MRS前20%的参与者观察到最强的效应大小(范围从3至5倍),表明在已知CAD人群中,MRS可能超过某一阈值后更强烈地影响MACE风险。即使在调整人口统计学因素、传统心血管风险因素和临床表型后,该关联仍然显著。MRS与缺血性中风之间观察到的无显著关联可能是由于队列中缺血性中风事件数量相对较少导致统计效率不足。此外,将MRS添加到基于传统风险因素的模型中略微改善了风险预测,与单独基于传统风险因素的模型相比,校准性能更好(但幅度适中)。

先前的研究在很大程度上证明了MRS与无CAD病史个体不良心血管事件之间的关联,针对二级事件人群的研究有限。然而,在已有CVD个体中进行的少数研究受到样本量小、随访时间短或代谢组学生物标志物较少的限制。例如,Rizza等人在67名已有CVD的患者中随访3.5年后,确定了仅2种49种代谢物(丙氨酸和中长链酰基肉碱)与MACE风险增加之间的独立关联。Mehta等人在776名CAD患者的合并队列中分析了6500多种代谢物,随访3年,发现包含肌酐的7种代谢物风险评分独立预测全因死亡。最近,Zhu等人报告了15种代谢物(主要是氨基酸和糖酵解相关代谢物)与1606名CAD患者随访3.5年后的全因死亡之间的显著关联。使用来自大样本队列的长期随访数据,我们的研究扩展了这一证据,为中年CAD人群中代谢组学生物标志物对次要MACEs风险的长期影响提供了更全面的理解。此外,与先前发现一致,新MRS与MACEs的关联比单个代谢组学生物标志物更强,突显了将多种生物标志物组合成综合风险评分的潜在效用。我们的研究发现,当MRS添加到临床风险评分时,预测性能有适度改善,这与先前在主要事件人群或2型糖尿病患者中的研究结果相似。这解决了在二级预防环境中理解MRS性能的重大差距,因为在这些环境中,此类证据一直有限。

MRS内的几种关键代谢物,如葡萄糖、肌酐、糖蛋白乙酰基和脂肪酸不饱和度,被发现与MACEs强烈相关,并为CAD患者CVD进展的潜在机制提供了重要见解。这些生物标志物中的许多可能与MACEs的其他已确立风险因素相关,如炎症和代谢功能障碍,这可以解释它们与MACEs的关联及其对MRS预测价值的贡献。例如,作为炎症生物标志物的糖蛋白乙酰基已涉及动脉粥样硬化的发病机制。同样,肌酐和葡萄糖升高强调了肾功能障碍和高血糖对增加MACE风险的贡献。此外,脂肪酸不饱和度可能表明脂质代谢紊乱,促进炎症和氧化应激,这是心血管事件发生和发展的关键机制。虽然MRS在MACE风险预测中的总体性能适中,但机器学习工具的使用帮助发现了先前与2型糖尿病等其他 cardiometabolic 疾病相关的代谢物,但在CAD患者中的效用有限或尚未确立。重要的是,将这些单个代谢物组合成综合评分,而不是单独评估它们,已在先前研究中显示可以增强它们与心血管结局的关联并改善预测性能,支持综合代谢组学风险模型的潜在效用。

虽然将MRS添加到SMART2模型仅在区分度和校准方面产生了适度改善,但对于CAD等高风险人群中像MACEs这样严重且普遍的心血管结局来说,这可能仍具有一些临床相关性。这种预测性能的小幅提升在应用于大人群时,可能会潜在影响临床决策并转化为公共卫生效益。然而,我们承认,在常规护理中实施代谢组学分析的成本和复杂性需要进一步研究,以客观评估MRS的临床效用,包括其成本效益、稳健性和在不同人群中的普遍适用性。此外,通过单一基于血浆的代谢组学分析捕获MACEs潜在生物学通路的额外见解的能力,可能支持新型治疗靶点的开发。由于血浆代谢物更接近疾病表型,它们可能比传统风险因素更直接地反映潜在的病理生理过程。

本研究的一个主要优势是使用机器学习算法进行模型开发,而非传统统计方法。具体而言,我们使用了惩罚弹性网络回归,这是一种整合了最小绝对收缩和选择算子和岭回归惩罚的正则化方法,以优化变量选择。该方法在解决传统统计模型中常见的多重共线性和过拟合问题的同时增强了预测准确性,传统统计模型在变量选择中优先考虑统计显著关联,而非预测性能。我们的研究有一些局限性。首先,UKB中的参与者主要是欧洲血统,缺乏独立的外部验证队列进一步限制了我们发现在更广泛和更多样化人群中的普遍适用性。未来的研究有必要在更多样化的队列中验证这些发现。其次,UKB表现出健康志愿者偏倚,可能影响我们发现与一般人群中疾病真实患病率的比较。然而,由于暴露-疾病关系不一定需要代表性人群,并且我们的研究集中在已确诊CAD的个体上,这种偏倚对我们结果的影响可能很小。此外,尽管我们的研究与先前研究相比包括了更多的代谢组学生物标志物,但MRS仍基于26种生物标志物的有限面板。未来研究可以通过纳入更全面的代谢组学生物标志物面板来完善和提高MRS的预测性能。

总之,我们的研究表明,26种代谢组学生物标志物评分与已确诊CAD的中年人群不良心血管事件显著相关。虽然将MRS添加到基于传统风险因素的模型中使MACE风险预测有适度改善,但其在现实世界设置中的临床效用和增量价值值得进一步评估。随着代谢组学在临床实践中的可及性提高,其能够从单一标本在一次检测中评估广泛的代谢标志物的能力,相比传统风险评估措施(通常需要随时间进行多次检测)具有明显优势。这些发现,连同先前利用机器学习和代谢组学的研究见解,有可能推进我们对复杂生物通路的理解,并改善CVD患者的风险分层,最终有助于更高效和个性化的临床决策。

【全文结束】

大健康
大健康