摘要
纤维化的特点是伤口愈合异常以及过量纤维结缔组织的积聚,尤其是在细胞外基质(ECM)中。这种情况可能发生在多个器官中,最终导致器官衰竭。尽管纤维化的负担很重,但治疗选择仅能延缓疾病进展。因此,我们利用公开可用的蛋白质组学数据,研究是否能在不同器官中找到共同的纤维化相关蛋白和通路,以定义与纤维化相关的潜在核心变化。我们鉴定出124种在心脏纤维化中显著差异表达的蛋白,4种在早期与轻度肝纤维化中,135种在轻度与重度肝纤维化中,以及160种在早期与重度肝纤维化中。对这些蛋白组的功能注释显示,ECM蛋白一致上调,而与线粒体活性相关的蛋白一致下调。利用这些数据进行药物重定位,我们提出了26种化合物供进一步研究,其中20种已显示出有希望的抗纤维化效果。心脏纤维化和肝纤维化共享一组核心的18种蛋白,这些蛋白与ECM沉积增加和成纤维细胞活化相关。这种方法可以推广到其他病理情况,改进对受影响分子通路的认识,并据此识别潜在的药物候选物。
纤维化的特点是伤口愈合异常,可能由各种组织损伤引起,并在多个器官(如肝脏、心脏、肾脏、肺)中表现出来。尽管器官之间存在特异性差异,但在所有受影响的器官中,通常都会观察到炎症增加和细胞外基质(ECM)蛋白沉积,最终导致器官衰竭。最常受影响的器官是肝脏(影响全球四分之一人口)、肾脏(影响六分之一人口)、心脏(影响六十分之一人口)和肺(影响一千五百分之一人口)。尽管纤维化的负担很重,但临床治疗仅能延缓疾病进展,尽管在肝纤维化领域已取得近期进展。因此,迫切需要更好地理解纤维化疾病机制,推动基于证据的抗纤维化药物筛选。为了便于在分子水平上研究纤维化,我们建立了一个蛋白质组学资源库,汇编了通过系统搜索获取的现有相关数据集。利用这一资源,我们研究了是否能识别出不同器官(心脏、肝脏)中共享的共同纤维化蛋白特征和差异调控通路。最后,我们进行了分子驱动的药物重定位,并通过计算机模拟进一步验证了所识别药物候选物的生物学相关性。这种方法可以推广到不同疾病,有助于更好地理解疾病相关的分子变化,并利用这些知识提出药物候选物。
我们从ProteomeXchange及其存储库PRIDE和MassIVE中识别了公开可用的蛋白质组学数据集,重点关注与心脏、肝脏或肾脏纤维化相关的慢性疾病。总共选择了三个心脏数据集、三个肝脏数据集以及两个肾脏纤维化数据集。简而言之,根据适用情况,使用Proteome Discoverer v1.4对数据依赖采集(DDA)数据或使用DIA-NN v1.9.1对数据非依赖采集(DIA)数据进行了重新分析。对于通过质量控制的数据集,蛋白质导出结果可在相关表格中查看。对于心脏和肝脏数据集,在去除缺失值超过70%的样本和蛋白质后,使用Wilcoxon秩和检验来识别差异蛋白表达,随后进行Benjamini–Hochberg(BH)多重检验校正。由于质量担忧(主要是血液污染),两个肾脏数据集未被纳入进一步分析。对于剩余数据集,BH校正p值<0.05、在至少另一个检查相同器官的数据集中具有名义显著性,且在该器官所有数据集中log2倍变化趋势一致的蛋白质被视为显著。进一步应用STRING网络分析和使用MSigDB的基因集变异分析(GSVA)对差异表达蛋白进行通路映射。最后,使用基于网络的药物重定位与探索(NedRex)和Cytoscape 3.10.3版本进行药物重定位分析,以筛选针对纤维化关键蛋白和通路的化合物。
在心脏纤维化中,124种蛋白质在三个数据集中的至少两个中共享(在至少一个数据集中经BH校正后显著,在至少另一个数据集中名义显著,且在所有心脏数据集中log2倍变化趋势一致)。类似地,在早期与轻度肝纤维化中识别出4种共享蛋白,在轻度与重度肝纤维化中有135种,在早期与重度肝纤维化中有160种。在相关表格中,报告了病例和对照组的ppm标准化和log2转换后的平均丰度值,以及相应的标准差、log2倍变化和(未)校正p值。早期与轻度肝纤维化中共享蛋白数量较少的情况已有先前报道。此外,在早期与轻度比较中的所有四种蛋白在肝纤维化数据集2中经BH校正后显著,在肝纤维化数据集3中名义显著。心脏纤维化和肝纤维化之间有18种蛋白质是共有的,在纤维化与非/早期纤维化阶段表现出一致的上调,且主要是与ECM相关的(14种),这些蛋白质在补充信息中列出,并在图1中展示。
利用蛋白-蛋白相互作用数据库StringDB,对心脏纤维化中共享的差异表达蛋白以及随后在三个肝纤维化比较中的相互作用进行了计算机模拟分析。考虑到早期与轻度肝纤维化中共享的、一致的蛋白变化数量较少,无法生成网络。剩余三个网络使用Markov聚类算法进行聚类,并显示与ECM相关的蛋白上调和参与细胞代谢的蛋白下调。
GSVA分析进一步支持了心脏纤维化和肝纤维化之间共享通路反映了线粒体活性和分解代谢过程降低,同时ECM合成(特别是胶原蛋白和蛋白聚糖)和降解增加、细胞-基质相互作用、对转化生长因子β相关信号的反应以及上皮-间质转化(EMT),这与早期发现一致。
最后,使用NedRex,综合三项分析的结果,基于心脏纤维化蛋白和任一肝纤维化比较的蛋白,确定了26种化合物作为潜在治疗候选物。这些药物的靶点在图2中显示或在表格中列出。对于其中20种,临床前研究或早期临床试验支持它们在心脏和肝纤维化中的相关性,包括锌、槲皮素、伊马替尼、尼达尼布(已获批用于特发性肺纤维化)、达沙替尼、索拉非尼、阿昔替尼、厄洛替尼、他莫昔芬;针对心脏纤维化的吡哆醛磷酸、鲁比司他丁、咪康唑、铜;以及针对肝纤维化的舒尼替尼、尼洛替尼、芦可替尼(已获批用于骨髓纤维化)、来那替尼、帕唑帕尼、吉非替尼、氯丙嗪。烟酰胺腺嘌呤二核苷酸氢(NADH)被预测但尚未报告在纤维化中的作用。
有趣的是,26种化合物中有17种是蛋白激酶抑制剂。确实,如先前研究所示,激酶在纤维化中起着至关重要的作用,并代表了一个有吸引力的治疗靶点。然而,仍然存在挑战,例如导致毒性的脱靶效应。其他翻译后修饰也被报道在心脏和肝纤维化中起重要作用(例如,氧化、乙酰化、糖基化、琥珀酰化和S-棕榈酰化),目前正努力探索它们的可药用性。
这些结果强调,尽管存在组织特异性差异,但心脏和肝纤维化之间可能存在共同的疾病过程。总的来说,利用公开可用的蛋白质组学数据,我们识别出心脏和肝纤维化中共享的18种差异表达蛋白,反映了成纤维细胞活化和ECM重塑。需要注意的是,在肝纤维化分析中,大多数蛋白质在肝纤维化数据集2中经BH校正后显著,这可能归因于该数据集中患者在相应亚组中的分布更为均匀。此外,由于不同数据集之间识别出的蛋白质数量存在异质性,可能无意中引入了偏差。然而,我们要求在多个数据集中存在以减少偏差,并仔细验证了我们在文献中的发现,这共同最小化了假阳性的风险。据我们所知,这是第一个呈现不同器官中纤维化共享分子特征的资源。
该资源可可靠地用于改善对心脏和肝纤维化的理解以及它们是否具有共享的分子特征,同时有助于优先考虑对相关药物的进一步研究。所采用的流程可以推广并应用于其他疾病背景。
【全文结束】


