摘要
衰老与多种慢性疾病相关,并具有多样化的标志。线粒体功能障碍被认为与衰老有关,而人工增强线粒体DNA突变率的小鼠模型显示出加速的衰老。衰老的一个鲜为人知的方面是因为它在聚合分析中不可见,即单个细胞中独特的线粒体DNA突变(隐性突变)的积累。我们从三个物种的多种单细胞数据集中发现了隐性线粒体DNA突变的证据,并发现:隐性突变构成了老年后有丝分裂后组织中线粒体DNA突变的绝大多数,它们可以避免选择压力,其积累符合我们发展的理论,在特定物种的中晚期生命时达到高水平,并且它们的存在与大多数衰老标志物相关,包括蛋白质错误折叠和内质网应激。我们通过实验确定了与内质网应激的机制联系,并进一步表明,携带高比例隐性突变的老年脑细胞表现出神经退行性标记,并且限制热量摄入可以减缓隐性突变的积累。
结果
隐性突变是主要形式,并在其积累与寿命一致
已证明scRNA-seq可用于识别线粒体DNA突变,我们进一步证实了该技术的有效性。我们利用从scRNA-seq和scATAC-seq获得的突变信息来研究不同年龄的线粒体DNA突变情况。
线粒体DNA突变的异质性 h 是指细胞中携带该突变的线粒体DNA分子的比例。经验上,我们根据携带该突变的读段比例为每个突变分配一个异质性值(见“方法”部分的公式 (1))。接下来,我们利用分布和比较方法确保测序和变异推断中的不可避免误差不会影响结果:特别是,我们考虑了每个突变位点仅在一个细胞中出现且具有相应单细胞异质性的隐性异质性分布。通过记录样本中每个细胞中所有隐性线粒体DNA突变的异质性并构建显示观察到的不同异质性频率的直方图,可以从细胞集合中找到隐性异质性分布。我们将这种隐性异质性分布称为“隐性位点频率谱”(cSFS),它是群体遗传学中的一个自然对象。通过对这些异质性的分布进行统计,我们可以计算出随机选取的隐性突变具有特定异质性的概率(我们在扩展的位点频率谱概念中包括同质突变(100% 异质性突变)(示例见图1c, f))。
图1:隐性线粒体DNA突变是一种主要的突变形式,并在后期生活中达到生理相关水平。
a 组织中的细胞携带两种类型的突变——那些在多个细胞中共有的突变和那些仅存在于单个细胞中的突变。b 我们利用来自不同年龄个体的组织的scRNA-seq和scATAC-seq,汇集每个细胞中的变异,不仅可以构建表达矩阵,还可以检查组织的位点频率谱,并将单个细胞的表达变化与推断的线粒体DNA突变负荷联系起来。c 通过使用非平衡无限位点Moran模型建模亚细胞群体遗传学(左),我们可以预测隐性线粒体DNA突变的归一化位点频率谱如何随一生演变,并预测老年个体中高异质性突变的积累(右)。d 单细胞测序对于揭示组织的真实突变负荷是必要的。总共90.8%的线粒体DNA突变的伪批量异质性 h < 0.5%(用蓝色标记),因此在大多数批量实验中无法可靠检测(数据取自参考文献30中发现的所有突变)。e, f 隐性位点频率谱(cSFS)随时间演变。我们看到,对于来自3个人类数据集的19名个体,跨越不同组织和不同的测序技术,两个谱之间的秩双序列相关距离(RBC-差异,一种衡量从一个谱中抽取的突变比另一个谱中抽取的突变具有更高异质性的可能性的指标)随着个体之间的年龄差异增加(双侧Spearman相关 r ≈ 0.70 和 p < 10^−26)。通过直接查看一对谱的例子(f),我们看到,正如我们的理论预测的那样,高异质性的突变积累(有关每个归一化cSFS所代表的细胞和突变数量的详细信息,请参见表S5,所有供体的cSFS请参见补充图S9)。g 人类胰腺细胞中潜在致病的隐性突变的线粒体负荷 _μ_10% 随着年龄的增长而增加。我们展示了参考文献30中所有8名供体的 _μ_10%,并观察到随年龄增长的趋势(双侧Spearman相关 r ≈ 0.04 和 p < 0.049),并且对于更大的异质性阈值观察到更强的效果(详见补充讨论S8.5)。线粒体负荷 _μ_10% 的标准差 σ(_μ_10%) 也随年龄增长(蓝色星号;双侧Spearman相关 r ≈ 0.88 和 p < 0.005)。
首先,我们检查了涵盖两个物种、三种组织类型和三种测序技术的五个scRNA-seq数据集,以展示我们结果的广泛适用性30,31,32,33。尽管这些测序技术提供的线粒体基因组覆盖水平不同(见补充图S20),但我们发现即使将高覆盖率数据集降采样以匹配最低覆盖率,我们的主要结论仍然不变(见补充图S24)。通过单细胞水平的数据,我们看到在批量测序实验中可检测到 h ≥ 0.5% 异质性的突变只占组织中突变的约9%(图1d)。在批量异质性 h < 0.5% 的约91%的突变中,几乎所有(约94%)都只出现在单个细胞中。
我们假设,受理论支持(稍后讨论),cSFS会随着时间逐渐扩散到更高的异质性(图1c)。我们比较了不同年龄的人类供体的cSFS,以了解其如何随生命周期演变,并发现,与假设一致,两个个体的年龄差距越大,其cSFS的差异越大,如通过成对比较的所有细胞之间的秩双序列相关差异(RBC-差异)测量所示(见图1e, f,每个数据点是比较两个个体的所有细胞,见补充图S25用于替代度量比较;当限制于胰腺的一种细胞类型时,这些结果得以保留,见补充图S26aa–c)。两个cSFS(A和B)的RBC差异是衡量从A中抽取的突变比从B中抽取的突变具有更高异质性的可能性(见“方法”部分)。为了排除文库制备和测序可能引入的错误,我们仅考虑异质性 h > 10% 的隐性突变(见“方法”部分和补充讨论S6)。
接下来,我们识别出一个单细胞人类胰腺数据集30中携带可能有害突变的细胞。为此,我们计算每个细胞的隐性突变线粒体DNA负荷 _μ_10% 作为所有非同义蛋白编码突变的异质性超过10%的所有隐性突变的总和(见“方法”部分的公式 (2))。我们发现线粒体DNA突变负荷 _μ_10% 随年龄增加(见图1g)。此外,我们观察到线粒体DNA突变负荷的标准差随年龄增加,表明细胞异质性随年龄增加。异质性阈值 h > 10% 时,年龄 t 与线粒体DNA突变负荷 _μ_h% 之间的相关性 Corr( _μ_h%, t) 在所有异质性阈值下均显著(见补充图S28和S29),表明隐性突变的积累早在低异质性阈值时就已经开始,但在广泛的异质性范围内均可观察到。
为了确认这些结果反映了基础的线粒体DNA,我们还检查了一个来自老年人脑部的10x单核ATAC-seq数据集34,提供了一种正交测序模式,支持我们的假设,即较老个体的cSFS向更高的异质性转移(见补充图S19)。我们还检查了一个跨物种的人类、小鼠、猪和大鼠肺部的10x scRNA-seq图谱35,并确认年轻的小鼠、猪和大鼠细胞没有高异质性的隐性突变。
隐性突变以与理论一致的方式达到生理相关水平
我们使用群体遗传学中建立的前向模拟方法——Moran模型36,模拟如果细胞从没有隐性突变开始并在一生中逐渐积累这些突变,则cSFS应如何随时间演变,图1c(见“方法”部分)。我们的模拟预测cSFS直方图应在较高异质性处的突变数量随年龄增加(图1c),并且具有达到高异质性的特征年龄。在Moran模型中,线粒体DNA复制和消除以保持种群恒定;新发突变以固定速率发生,突变通过随机出生和死亡在种群中传播。使用Moran模型,在长时间极限下,细胞内线粒体DNA集合有一个共同祖先的时间期望值与细胞内线粒体DNA数量和线粒体DNA种群半衰期的乘积成正比:快速出生-死亡或较小的种群导致突变更快固定。为了发展完整的理论,我们使用群体遗传学中建立的后向模型——Kingman共祖模型37拟合Moran模型,该模型捕捉了包括Moran模型在内的广泛前向模型(详见补充讨论S1和S2的详细信息)。
我们使用贝叶斯推理将我们的cSFS模型拟合到人类数据集。简而言之,我们的模型为来自供体组织的一组细胞拟合“线粒体年龄”, W 和缩放突变率,Θ。我们的模型很好地拟合了各种个体的cSFS(详见补充讨论S2.4的完整拟合细节),我们发现每个个体的推断线粒体年龄随每个个体的年代年龄增加:为组织提供了一个生物年龄标记和候选老化时钟38(图2a,这些结果在单细胞类型时重复,见补充图S26)。通过假设细胞的线粒体DNA拷贝数 N ,我们可以将推断的缩放突变率Θ转换为每次复制每碱基的突变率 µ 使用公式Θ = N µ。假设每个细胞有1000个线粒体DNA,我们推断每次复制每碱基的突变率的最大后验估计值为4.6 × 10^−8,与文献一致39(图2b,详见补充讨论S2的详细信息和完整拟合结果,以及补充图S26显示仅使用参考文献30中的α细胞时趋势再现)。
图2:隐性线粒体DNA突变以与时钟类似的方式演化,符合理论并能推断线粒体DNA突变率。
a 我们展示了每个供体的线粒体年龄可信区间的95%,并展示了最大后验(MAP)估计的回归,以及中位推断共祖年龄的95%可信区间(见补充讨论S2)。b 假设每个细胞有1000个线粒体DNA,展示了每次复制每碱基突变率的后验分布,其中MAP估计值为4.6 × 10^−8。c 当使用MAP参数估计值建模时,高于某个阈值的异质性突变比例在人类寿命的时间尺度上达到平衡。d 人类细胞中每细胞(按观察到的碱基数标准化)的同质突变数量随年龄增加(Spearman相关 r ≈ 0.89 和 p < 10^−7)。同样,我们也在来自2个组织和16只小鼠的样本中观察到了同质突变的累积(Spearman相关 r ≈ 0.85 和 p < 10^−4)。e 我们查看了每细胞同质突变数量的MAP估计值相对于时间的一阶和二阶导数。这可以大致等同于衰老的速度和加速度。衰老加速度的峰值出现在大约40岁左右。f 使用MAP估计值,我们查看了携带高于某一阈值突变的细胞比例。大约20岁时,细胞开始携带高于60%异质性阈值的突变,到40岁时,相当一部分细胞携带异质性高于60%的突变,并且细胞开始累积同质突变(100%异质性)。到80岁时,几乎30%的细胞预计会有同质突变,近一半的细胞预计会有异质性高于60%的突变。
(全文结束)


