成人人类心脏与心力衰竭的单细胞剪接异构体图谱Single-Cell Splicing Isoform Atlas of the Adult Human Heart and Heart Failure | Circulation

环球医讯 / 心脑血管来源:www.ahajournals.org美国 - 英语2025-10-03 21:14:14 - 阅读时长29分钟 - 14282字
本研究利用长读长单细胞核RNA测序技术构建了成人人类心脏及心力衰竭状态下的剪接异构体图谱,揭示了心脏细胞系统中异构体多样性的广泛存在及其作为转录后缓冲系统的重要功能。研究发现健康心脏中约30%的细胞类型特异性基因使用多种异构体,心力衰竭状态下心肌细胞中有379个基因表现出显著的异构体使用变化,这些变化可能通过改变蛋白质编码序列直接影响心脏功能。该研究为理解心脏疾病的分子机制和开发新型诊断治疗策略提供了重要基础,具有显著的临床转化价值。
成人人类心脏心力衰竭单细胞剪接异构体图谱长读长单细胞核RNA测序异构体异质性异构体使用变化心脏细胞类型细胞状态治疗靶点心脏健康
成人人类心脏与心力衰竭的单细胞剪接异构体图谱

摘要

背景:

选择性剪接通过影响蛋白质编码序列、功能域和分子网络,在正常心脏发育和心脏疾病中发挥关键作用。然而,人类心脏异构体景观的详细特征仍不完整。

方法:

利用长读长单细胞核RNA测序和计算分析,我们解析了成人左心室在不同细胞类型、细胞状态和心脏条件下全长异构体的异质性、表达模式和使用变化。我们应用了计算机方法评估已识别异构体的功能相关性;使用逆转录定量聚合酶链反应和靶向扩增子测序验证了代表性心脏基因的异构体组成;并开发了一个网络服务器用于交互式浏览我们的结果。

结果:

数据揭示了异构体异质性在心脏细胞系统中广泛存在,作为校准人类心脏分子储备的转录后缓冲系统。在健康左心室中,约30%的细胞类型特异性基因是多形的,使用多种适合细胞类型特异性程序的异构体。在普遍表达的基因中,超过300个显示出具有细胞类型特异性的差异异构体使用。与心力衰竭相比,心肌细胞中有379个基因表现出明显的异构体使用变化,其中大多数预测会通过蛋白质编码序列的直接变化以及内含子保留和非蛋白质编码生物类型之间的切换来改变蛋白质编码结果。相比之下,细胞状态特异性程序倾向于在与细胞状态变化相关的单形基因上运行。此外,我们的数据揭示了心脏微环境中基质和免疫细胞类型与心力衰竭相关的差异异构体使用事件。

结论:

我们通过长读长单细胞核RNA测序和综合计算分析,呈现了正常成人心脏和心力衰竭的剪接异构体综合图谱。结果表明异构体在缓冲核心细胞程序和促进疾病相关细胞状态方面发挥关键作用。这些细胞特异性异构体的全长细节为下游转化和机制研究提供了重要参考。

临床视角

有什么新发现?

  • 长读长单细胞核RNA测序提供了成人人类心脏在正常和心力衰竭条件下细胞类型特异性异构体的全面景观。
  • 异构体异质性和剪接调控在心脏细胞类型的广泛转录程序中普遍存在,尤其在心肌细胞中尤为明显。
  • 心力衰竭与心肌细胞中明显的异构体使用变化相关。

临床意义是什么?

  • 在真实病理生理条件下对人类心脏中细胞类型特异性异构体的长读长测序,允许对与正常和疾病状态相关的转录本编码序列进行精确和全面的调查。
  • RNA异构体对于理解心脏疾病至关重要,其中转录本序列的全长细节能够更好地发现新的治疗靶点和开发更准确的诊断策略。

最近的单细胞转录组学研究数据帮助构建了成人人类心脏复杂细胞生态系统的景观,但延伸到整体基因表达模式之外的大量知识空白仍然存在。超过90%的人类基因具有一个以上的外显子,通过选择性剪接产生多种mRNA异构体,从而影响蛋白质多样性、细胞功能和致病机制。因此,RNA异构体一直是心脏疾病研究的热点话题,几项开创性研究揭示了剪接过程异常与心脏病理生理学之间的强关联。尽管取得了相当大的进展,但由于缺乏能够在保持细胞类型粒度的同时捕获全长异构体结构的稳健方法,人类心脏的RNA异构体景观在很大程度上仍未得到充分探索。

长读长单细胞RNA测序代表了异构体分析方法的重大进步,实现了以细胞特异性方式对全长转录本进行高通量分析。在这里,我们通过利用我们最近开发的单细胞核纳米孔(长读长)RNA测序平台,构建了成人人类左心室的综合剪接异构体图谱。数据揭示了异构体异质性和使用变化在跨细胞类型、细胞状态和心脏条件的细胞程序中广泛存在。在健康心脏中,在跨细胞类型的普遍表达基因中发现了异构体使用变化,揭示了剪接调控与细胞类型特异性表型之间的关联。在心力衰竭中,与健康对照相比,我们在心肌细胞中观察到明显的异构体使用变化。计算机功能研究表明,通过蛋白质编码序列的直接变化以及内含子保留和蛋白质编码生物类型之间的切换所导致的编码结果改变,可能影响与心脏疾病发病机制相关的关键蛋白质。为便于探索这些结果,我们构建了一个可免费访问的网络服务器。

方法

组织获取

所有冷冻心脏组织均从休斯顿卫理公会医院DeBakey心脏与血管中心的移植诊所收集,并获得同意。研究这些组织多组学谱的机构审查委员会方案已获得休斯顿卫理公会研究所(批准号PRO00006097)和西北大学(批准号STU00216333)的批准。健康组织是从无心脏病史的已故捐赠者的左心室收集的。关于心力衰竭样本,通过超声心动图或磁共振成像确定梗死区域为缺血性心肌病,该区域位于左前降支冠状动脉供应的室间隔/左心室前区域附近。心脏在心脏中部切开,以便直接观察心室组织以确认缺血性心肌病状态。样本取自未受累区域(无明显纤维化),通常为左心室游离壁,也在心脏中部水平。样本仅包含心肌中层,在冷冻前去除了心内膜和心外膜。摘除后,每个心脏立即被带到手术室旁边的实验室房间。从接收心脏到在-80°C冷冻机中冷冻的估计时间为15分钟。组织经匿名化处理后,在材料转让协议下,通过干冰箱从休斯顿卫理公会医院转移到西北大学。

新鲜冷冻心脏组织中单细胞核的制备

使用约50至100毫克组织进行单细胞核提取。使用剪刀在2 mL细胞核提取缓冲液(Miltenyi Biotec)中将组织切成小块,并加入0.2 U/µL RNase抑制剂(New England Biolabs),在gentleMACS Octo Dissociator中解离。将悬浮液在4°C下以300×g离心5分钟,通过70 µm MACS SmartStrainers过滤,并在额外的细胞核提取缓冲液中洗涤。然后在4°C下以300×g离心5分钟沉淀细胞核,并在1 mL细胞核重悬缓冲液(1× PBS含0.1% BSA和0.2 U/µL RNase抑制剂)中轻轻重悬。所有步骤均在冰上使用冰冻试剂进行。使用Countess II自动细胞计数器(Invitrogen)进行细胞核完整性和纯度的计数和评估。

纳米孔文库制备、长读长测序和数据处理

按照先前描述的方法进行单细胞核的snNanoRNAseq。每个样本使用约3000至6000个细胞核捕获10× Genomics Chromium Single Cell 3'方案(版本3.1)的条形码cDNA。使用SQK-LSK114试剂盒(Oxford Nanopore Technologies)制备文库。测序在内部PromethION上使用R10.4M流动池(Oxford Nanopore Technologies)进行,每个流动池加载1个样本。使用guppy(版本5.0.12)在超准确模式下进行基础调用。使用scNanoGPS(版本1.1)处理原始单细胞数据,其中共识读数使用minimap2(-ax splice模式;版本2.26)映射到参考基因组(GRCh38)。单细胞基因表达矩阵由共识BAM文件中的唯一分子标识符(UMI)计数汇总。

单细胞异构体定量和质量控制

使用IsoQuant(版本3.42)和Bambu(版本3.4.0)从共识BAM文件计算单细胞异构体谱,参考GRCh38(GENCODE v44)。由于极高读深度区域的计算限制,排除了MALAT1NEAT1和线粒体基因。接下来,使用SQANTI3(版本5.2.2)进行质量控制和结构注释。除被归类为完整剪接匹配(FSM)的异构体外,所有异构体均经过全长度覆盖筛选,需要refTSS(版本4.1)中5' CAGE峰的支持,并且至少在2个捐赠者中检测到,且至少有3个UMI。由IsoQuant确定并由SQANTI3进行质量控制的单细胞异构体谱用于下游分析。

单细胞基因表达、异构体表达和细胞-细胞相互作用分析

使用Seurat(版本5.0.1)进行单细胞基因表达分析。移除具有>8000个基因或>60,000个UMI的细胞作为异常值和疑似双胞。使用SoupX去除环境RNA。使用DoubletFinder(假设双胞率为0.8%)检测双胞。所有数据均通过HarmonyIntegration整合,随后使用FindNeighbors和FindClusters Seurat函数进行聚类和子聚类,基于肘部图的前20-30个周细胞。将具有明显线粒体基因表达或基因覆盖率显著较低的细胞视为低质量并移除。使用单细胞/单细胞核转录组研究中报告的细胞类型标记物对聚类进行注释。所有差异基因表达分析均使用Wilcoxon秩和检验进行Bonferroni校正。差异表达基因(DEGs)定义为Padjusted≤0.05且绝对Log2倍变化≥0.6的基因。

对于异构体表达分析,创建了一个包含来自30,683个细胞核的39,688个高质量异构体的Seurat对象,使用Seurat函数进行整合、聚类和差异异构体表达分析。差异表达异构体(DEIs)定义为Padjusted≤0.05且平均绝对Log2倍变化≥0.6的异构体。通过Jaccard相似性指数测量基于异构体和基于基因表达的细胞类型之间的细胞组成一致性,其中Jaccard相似性指数>0.6时将细胞类型标识分配给异构体衍生聚类。

使用CellPhoneDB(版本5.0.1)从单细胞基因表达谱分析细胞-细胞相互作用。选择参与显著相互作用的编码受体、配体或粘附分子的基因对用于下游异构体多样性表征。

异构体多样性分析

为减轻dropout问题,在伪批量水平上计算异构体多样性分数。首先,将每个组内细胞的异构体计数汇总,以计算每个基因所有检测到的异构体的相对比例。为解决跨基因的异构体数量偏差,使用Shannon熵仅使用相对比例最高的2个异构体评估每个基因的异构体多样性:

DI = -∑i=12piln(pi)

(1)

其中DI表示异构体多样性,p表示相对异构体比例。新型异构体计数从多样性计算中排除。用于细胞-细胞相互作用和管家异构体多样性的基因要求细胞类型中至少有15个总UMI。对于细胞状态,异构体多样性分析的基因要求至少有5个总UMI。

差异异构体使用分析

为识别差异异构体使用(DIU)事件,从细胞组聚合异构体计数以构建列联表。测试的基因要求在两组中至少5%的细胞中检测到异构体。此外,异构体要求在至少1个比较组中至少有10个UMI。仅检测到1个异构体的基因被排除。随后应用χ2检验,并使用Benjamini-Hochberg(假发现率)方法调整P值。基于Padjusted≤0.05和至少1个异构体比例差异超过10%,识别出显著的DIU事件。对于细胞类型特异性DIU事件的识别,对每个健康样本在细胞类型之间进行成对比较。显著的细胞类型特异性DIU事件需要至少在1次比较和2个独立样本中出现。为确保DIU枚举的非冗余性,每个基因在每次比较中仅限与单个DIU相关联。为确定疾病相关DIU事件,将异构体计数测试跨健康和心力衰竭细胞组聚合。

替代剪接机制分析

使用SUPPA(版本2.4)进行替代剪接机制的识别。使用Fisher精确检验进行细胞组之间剪接类别的统计比较。所有测试基因的替代转录起始和终止位点从CAGE峰(参考refTSS版本4.1)量化,并通过基因长度归一化的推断多聚腺苷酸化位点(PolyASite版本3.0)。随后应用Wilcoxon秩和检验进行统计比较。

基因集富集和基因本体论分析

使用R包clusterProfiler中的GSEA和enrichGO函数,分别对人类MSigDB集合中的生物过程本体集(Gene Ontology: Biological Process C5)进行基因集富集和基因本体论分析。显著富集结果定义为q≤0.05。为确定每个细胞类型中本体术语内单形或复形DEGs的富集情况,使用Fisher精确检验将每个本体术语中的单形/复形基因计数与所有DEGs进行比较。

异构体的逆转录定量聚合酶链反应

为验证选定基因(TNNI3KKLHL31MYLK3)的异构体检测,使用跨越外显子连接的异构体特异性引物面板进行逆转录定量聚合酶链反应(PCR)。使用Monarch Spin RNA分离试剂盒(New England Biolabs)从所有6个健康捐赠者的剩余心脏组织中提取总RNA。使用iScript Advanced cDNA合成试剂盒(Bio-Rad)进行逆转录。实时PCR使用SYBR Green Universal Master Mix(Applied Biosystems),并在CFX Connect实时系统(Bio-Rad)上运行,95°C激活10分钟,随后95°C变性15秒和58°C退火和延伸30秒,共40个循环。所有反应均进行三次重复。使用管家基因GAPDH的平均Ct值计算ΔCt值。异构体之间的相对水平按照公式2-ΔΔCt计算,其中ΔΔCt=(ΔCt异构体A-ΔCt异构体B)。使用配对Wilcoxon秩和检验将异构体的相对水平与snNanoRNAseq结果进行比较。

异构体的靶向扩增子测序

为验证心肌细胞中ACTG1的异构体使用,在产生高质量扩增子的3个健康样本(ND178、ND182和ND202)上进行靶向测序。为确认与疾病相关的RSRP1异构体使用变化,在3个健康样本(ND178、ND202和ND236)和3个心力衰竭样本(HF374、HF378和HF380)上进行靶向测序。在条形码cDNA(snNanoRNAseq中的剩余等分试样)上进行靶向异构体的PCR扩增,使用跨越ACTG1RSRP1特定剪接连接的异构体特异性5'引物和针对TruSeq R1适配器的通用3'引物。使用TruSeq R1引物捕获细胞和UMI条形码以进行单分子的细胞特异性量化。将所有扩增子混合并在PromethION上测序,使用1个流动池(R10.4M;Oxford Nanopore Technologies)。使用scNanoGPS功能处理数据,通过折叠具有相同UMI条形码的读数去除PCR重复,并排除未映射到靶向基因的读数。

数据可视化方法

除非另有说明,可视化使用tidyverse R包中的ggplot2准备。DEGs、DIUs和DEIs的热图使用ComplexHeatmap R包准备。异构体轨迹使用ggtranscript R包准备。Sashimi图使用ggsashimi R包准备。

统计方法摘要

使用Wilcoxon秩和检验进行Bonferroni校正识别DEGs和DEIs。DIUs通过χ2检验进行假发现率校正分析。Fisher精确检验用于比较细胞组之间的替代剪接事件和单形/复形富集。本研究中使用的所有显著性阈值均设置为0.05。

材料和数据可用性

所有原始和处理后的snNanoRNAseq数据均存放在Gene Expression Omnibus中(登录号GSE288222)。用于浏览所有样本异构体数据的网络服务器以及数据分析代码通过GitHub仓库发布( SCP1849)访问。本研究未生成新的独特试剂。

结果

高通量长读长单细胞核RNA测序再现了冷冻人类左心室中的复杂细胞生态系统

为深入表征健康和衰竭成人心脏中细胞类型特异性和细胞状态特异性的异构体,我们将最近发表的snNanoRNAseq应用于从健康心脏(n=6)和终末期缺血性心力衰竭心脏(n=6)捐赠者的左心室收集的新鲜冷冻组织(图1A和表S1)。这种高通量方法总共生成了约13亿长读长,每个细胞平均深度为43,699个读长,覆盖2,194个基因(表S2)。经过过滤(见方法),我们恢复了10种主要心脏细胞类型的30,683个高质量长读长转录组,包括心肌细胞、成纤维细胞、血管内皮细胞(ECs)、淋巴管内皮细胞、周细胞、血管平滑肌细胞、髓系细胞、淋巴细胞、神经元和心内膜细胞(图1B)。我们观察到心肌细胞、成纤维细胞和内皮细胞是在所有样本中捕获的最丰富的细胞类型(图1C),而周细胞在心力衰竭中显著减少(Wilcoxon检验;P=0.009),表明与心力衰竭相关的血管稳态破坏。这些细胞簇在非疾病和心力衰竭组织中均高度表达已知的细胞类型特异性标记物(图1D和表S3)。我们将我们的长读长图谱与左心室的类似下一代测序单细胞核RNA测序图谱进行了比较。结果不仅显示了细胞组成的高度一致性(图S1A和S1B),还揭示了每种细胞类型的基因表达谱高度可比(图S1C)。

基因集富集分析显示心力衰竭中关键收缩和代谢过程的活性降低,血管生成相关特征增加(图1E和表S4和S5)。此外,我们观察到与心力衰竭相关的转录重编程,如心肌细胞中广泛的EGR1上调和成纤维细胞中的POSTN,与先前研究一致。与针对LKB1(肝激酶B1)的心力衰竭新兴治疗一致,我们在内皮细胞中识别出LKB1通路中基因的显著上调,如SIK1PDE4DFOS(图1F)。此外,编码剪接因子和关键剪接体成分的多个基因在心肌细胞、成纤维细胞和内皮细胞中差异表达。这些数据为成人人类心脏左心室的细胞组成提供了长读长解释。

异构体异质性在涉及细胞类型特化、管家和细胞-细胞相互作用的多样化细胞程序中普遍存在

为更好地表征单细胞异构体谱,我们将IsoQuant(一种稳健的长读长异构体定量方法)整合到我们的scNanoGPS管道中,以UMI计数量化单细胞共识读数中的异构体。接下来,我们应用SQANTI3评估异构体的质量指标,并从我们的样本中识别出63,806个真实全长异构体(表S6)。在所有高质量异构体中,48,034个(75.3%)被归类为与参考(GENCODE版本44)的完整剪接匹配(FSM),跨越18,817个不同基因,大多数基因表达多个异构体(图2A和2B)。剩余的异构体中,约16%被归类为不完整剪接匹配,指出了完全解析异构体结构的固有挑战。为探索互补方法,我们使用Bambu(另一种领先的长读长异构体检测工具)进行了第二次异构体定量。由于其对模糊外显子分配的容忍度,Bambu识别出比IsoQuant更高比例的FSM异构体(98%对40%),但不完整剪接匹配(0%对25%)和新型(0%对13%)转录本较少(图S2A和S2B)。两种方法之间的每个异构体的平均深度相当,共检测FSM异构体(n=49,264)的表达水平表现出中等至强相关性(rs=0.632;图S2C-S2E)。Bambu倾向于保留表达明显低的异构体(图S2F)。我们继续使用IsoQuant量化结果进行下游分析,优先考虑FSM和新型异构体的高特异性。

接下来,检查转录起始位点以识别所有染色体上的4,993个高置信新型异构体(n=16,460预过滤),其中2,066个是新型目录内,具有从已知剪接位点剪接的新转录本结构,2,832个是新型目录外,包含至少1个新型剪接位点。39%的新型目录内和6%的新型目录外异构体涉及内含子保留事件。约74%的新型目录内异构体预测为蛋白质编码,而新型目录外异构体中为47%(图S3B)。这些新型异构体在非疾病样本的所有主要细胞类型中高度表达(图S3C),为基因如TTNMYOZ2增加了异构体库(图S3D和S3E)。由于大多数新型异构体的功能影响在很大程度上未知,我们集中分析FSM异构体以了解其与人类心脏中细胞类型和状态特异性功能的关联。

接下来,我们通过无监督聚类分析概念化全局异构体表达模式,解析了具有不同DEIs集合的8个主要细胞簇(图2C和2D和表S7)。在使用Jaccard相似性指数评估基于异构体的簇和基于基因表达的注释细胞类型之间的细胞一致性后,将细胞类型标识自信地分配(Jaccard相似性指数>0.6)给5个簇,除了簇4、7和8(图2E、图S4A和S4B和表S8)。我们怀疑这3个未分配簇的模糊性可能源于低质量细胞的存在。确实,簇4和7表达的DEIs数量少得多(分别为n=21和42),而簇8仅包含38个细胞。

为量化单个基因的异构体异质性程度,我们设计了Shannon熵作为异构体多样性指数(DI),以测量前2个表达异构体之间的不均匀性(见方法)。在观察到DI与最主导异构体(MDI)比例之间几乎单调的趋势后,我们建立了一个阈值(DI=0.5),大致对应于MDI比例为80%(图2F)。DI较高的基因(≥0.5)被归类为复形,表示每个基因存在>1个主要异构体。DI较低的基因(<0.5)主要与1个主要异构体相关,被归类为单形。这种方法既区分了基因之间的异构体异质性,又解决了与每个基因相关异构体数量变化的测量偏差。对异构体多样性相对于基因大小和外显子数量的评估显示无显著相关性,暗示剪接机制的高效率(图S5)。

平均而言,29%的细胞类型特异性DEGs是表达>1个主要异构体的复形基因,心肌细胞表达最高比例的复形基因(33%),其次是髓系细胞(30%)、成纤维细胞(29%)、壁细胞(27%)和内皮细胞(27%;图2G和表S3)。单形基因在4种主要间质和免疫细胞类型的细胞类型特异性DEGs中富集(比值比,1.4至1.7;P<0.001),但心肌细胞中没有(表S9)。我们使用异构体特异性引物(表S10;见方法)在剩余非疾病心脏组织中对3个代表性心脏基因(TNNI3KKLHL31MYLK3)进行逆转录定量PCR,证实了主要/次要异构体和单形/复形多样性分类的状态(图S6)。

基因本体论分析揭示了关键细胞类型特异性功能术语中复形DEGs的广泛多样性(图2H和表S11)。我们观察到心肌细胞中细胞呼吸、内皮细胞中细胞连接组装和髓系细胞中抗原呈递程序中涉及大量复形基因。我们还在核心管家程序(如细胞呼吸、应激反应、核运输和细胞周期)中观察到复形基因的广泛使用(图2I和图S7)。在所有表达基因中,复形基因在心肌细胞、成纤维细胞、内皮细胞和髓系细胞的多个RNA剪接和mRNA处理程序中显著富集(图S8和表S12和S13)。

此外,我们观察到大量涉及细胞-细胞相互作用的复形基因(图2J和表S14),包括30.0%的编码配体的相互作用基因、30.6%的编码受体的基因和26.7%的编码粘附分子的基因(图2K和表S15)。这些发现共同揭示了异构体异质性在正常人类左心室中核心细胞功能、管家程序和细胞-细胞相互作用网络中的高普遍性。

普遍表达的基因通过DIU与细胞类型特异性程序相关

虽然细胞类型特异性转录程序塑造了不同的细胞表型,但许多基因在细胞类型间普遍表达。这些基因在异构体水平上是否存在有助于不同细胞程序的变异仍不清楚。为解决这个问题,我们进行了DIU分析,比较每个基因在细胞群体间的相对异构体使用(见方法)。我们识别出311个基因案例在细胞类型间具有显著DIUs(χ2 Padjusted≤0.05,异构体比例绝对差异≥10%),包括心肌细胞中99个、成纤维细胞中66个、内皮细胞中54个、髓系细胞中52个和壁细胞中40个(图3A和表S16)。具有DIU事件的基因在肌肉系统相关过程中显著过表达(表S17)。超过一半(67±13%)显示DIU的基因未被检测为DEGs,指出常规基因表达分析未揭示的异构体水平分歧(图3B)。与非DIU案例相比,在具有DIUs的基因中观察到更高频率的替代转录起始位点,表明异构体多样性的一种潜在调控机制(图S9A)。此外,我们观察到DIU导致的2种主要转变:稳定的MDI,其中MDI保持不变;和不同的MDI(dMDI),其中MDI在比较中不同(图3C)。dMDI转变往往与异构体多样性较低的基因相关,与稳定的MDIs相比(图3D),表明表现出DIU的基因,特别是导致dMDIs的基因,通过剪接调控具有较低的缓冲能力。我们怀疑dMDIs跨异构体生物类型切换导致的编码序列直接变化可能对受影响细胞产生更大的功能影响(图S10)。

导致dMDIs的最显著DIU事件涉及关键细胞类型特异性程序。TNNI3(编码cTnI的心脏肌钙蛋白I的普遍表达基因)在心肌细胞中表达1个蛋白质编码异构体TNNI3-201(ENST00000344887),以及2个具有内含子保留的异构体(TNNI3-206 [ENST00000587176]和TNNI3-201 [ENST00000344887]),但在其他细胞类型中仅TNNI3-201为主要异构体(图3E和图S11A)。另一个代表性的DIU案例是在γ-肌动蛋白基因ACTG1中发现的。蛋白质编码异构体ACTG1-205(ENST00000573283),编码保守的肌动蛋白结构域,在内皮细胞、成纤维细胞和髓系细胞中占主导地位,使用率>75%(图3F和图S11B)。然而,在壁细胞中观察到该异构体的减少,在心肌细胞中减少更为明显,心肌细胞表达dMDI—ACTG1-219(ENST00000679535)—含有保留内含子且无预测蛋白质产物。这些观察通过检查原始共识读数中的剪接连接得到证实(图3G和3H)。此外,我们进行了靶向扩增子测序(见方法),证明在心肌细胞中ACTG1的相对异构体比例在靶向和全基因组采样方法之间具有高度一致性(Wilcoxon P>0.05)(图S11C和表S18)。这些数据共同提供了强有力的证据,表明剪接调控针对细胞类型的独特功能需求进行定制,如心脏中心肌细胞的收缩和结构特性。

终末期缺血性心力衰竭与健康心脏相比显示多种细胞类型的异构体使用变化

为研究异构体使用如何与特定细胞类型中的心力衰竭相关,我们比较了每个细胞类型中心力衰竭和非疾病样本之间的异构体使用。总共379个基因在心肌细胞中表现出显著的疾病相关DIU事件(图4A和4B和表S19)。与我们之前的分析一致,这些DIU事件中的大多数(90%)是通过常规基因表达分析未被识别为疾病相关DEGs的基因(图4B),并且在细胞呼吸和ATP合成中显著过表达(表S20)。同样在心肌细胞中,我们观察到93个DIU事件在条件间导致dMDIs,其中高达40%的特征是蛋白质编码和内含子保留之间的异构体生物类型切换(图4C)。在检查异构体多样性与DIU易感性的关系时,心肌细胞中77%的疾病相关DIU事件描述了使用不同异构体集合的复形到复形转变,而11%的案例导致从复形到单形使用的转变(图4D)。参与差异使用的异构体富含替代5'剪接位点和内含子保留,而其他异构体表现出更高的互斥外显子和替代第一和最后一个外显子的发生率(图4E和表S21)。疾病相关DIU事件的基因显示出更高频率的替代转录起始位点(图S9B)。

在心肌细胞中检测到的顶级心力衰竭相关DIU事件中,我们观察到进化保守基因FRY的剪接差异巨大,该基因编码微管结合蛋白,已被证明在维持细胞极性方面发挥作用。虽然FRY的总体表达在几乎所有心肌细胞中都检测到高水平,但在健康组织中从具有62个外显子的长蛋白质编码异构体FRY-211(ENST00000642040)到心力衰竭样本中分类为内含子保留的短异构体FRY-208(ENST00000490410)存在显著转变(图4F和图S12A)。我们怀疑这种普遍基因的蛋白质编码产物减少可能与心力衰竭中心肌细胞中常见的形态学变化有关。在心肌细胞中发现的另一个顶级DIU事件是在RSRP1中,该基因参与剪接体复合物组装。在心力衰竭中,我们观察到蛋白质编码异构体RSRP1-202(ENST00000431849)的使用增加,而次要内含子保留异构体的使用在条件间没有变化(图4G和图S12B)。我们的靶向扩增子测序证实了心力衰竭样本与健康样本相比心肌细胞中RSRP1-202的增加(Wilcoxon P=0.796)(图S12C和表S18)。这些疾病相关DIU事件表明心肌细胞中与心力衰竭相关的剪接失调。

基质细胞的分析也揭示了许多功能相关的异构体使用转变。在成纤维细胞中,我们识别出53个表现出显著DIUs的基因,其中10个导致dMDIs(图4H)。这些受影响的基因涉及关键的组织重塑通路。例如,编码金属肽酶的NPEPPS表现出几个导致心力衰竭组织成纤维细胞中较短异构体的异构体使用转变(图S13A和S13B)。在LAMA2基因中,具有66个编码外显子的蛋白质编码异构体LAMA2-206(ENST00000618192)在心力衰竭中显著扩展,尽管该基因的主要异构体仍然是LAMA2-211(ENST00000687590),这是一种具有内含子保留事件的较短转录本(图S13C和S13D)。与心肌细胞和成纤维细胞相比,我们在内皮细胞(n=24)和壁细胞(n=26)中观察到更少的异构体水平差异,这些差异在心力衰竭和非疾病条件之间表现出显著DIUs(表S19)。

在免疫区室中,我们在髓系细胞中识别出21个显著DIU事件(图4H)。在编码I型Fc受体的FCGR2A中,规范异构体FCGR2A-201(ENST00000271450)在心力衰竭中约多50%,而FCGR2A-204(ENST00000461298),在非疾病组织中检测到的主要异构体,具有未定义的编码序列(图S14A和S14B)。LYVE1(一种常用于区分巨噬细胞亚型的基因)也表现出跨心脏条件的DIU事件。蛋白质编码异构体LYVE1-201(ENST00000256178)在心力衰竭中高度普遍,而含有提前终止密码子的LYVE1-202(ENST00000438354)在非疾病样本的髓系细胞中更为丰富(图S14C和S14D)。心力衰竭相关DIU基因在成纤维细胞和髓系细胞中在替代剪接相关通路中富集(表S20)。这些数据共同揭示了与终末期心力衰竭相关的显著剪接重塑事件。

疾病相关细胞状态表现出不同的异构体表达模式

为了解特定异构体谱反映在细胞状态中及其与心力衰竭的关联,我们分析了所有5种主要心脏细胞类型中样本间亚群的异构体多样性和表达模式。在心肌细胞中,我们观察到3个亚簇(CM1CM2CM3;图5A),其中CM1CM3的特征与先前报道的健康左心室中心肌细胞亚群密切相关。这些细胞状态一致主要来自非疾病样本(图5B)。相比之下,CM2在心力衰竭样本中更为普遍,表达与心肌病相关的基因升高,包括ANKRD1PLCE1(图S15和表S22),并且在肌肉收缩和发育通路中显著富集(表S23)。FB2成纤维细胞也在心力衰竭样本中扩展,过表达在与细胞外基质重塑相关的本体中富集的基因(表S23),表明这些成纤维细胞已采用激活状态。其他细胞类型中的疾病相关亚群包括次要血管生成毛细血管内皮亚群Cap-ang和CD16+单核细胞(CD16*+*Mo)。我们没有观察到壁细胞类型以外的突出亚群,但注意到心力衰竭中平滑肌细胞的增加。基于异构体表达的子聚类分析对已知细胞状态的恢复有限(图S16),我们怀疑这是由于单细胞异构体数据中添加的稀疏性。因此,我们专注于明确定义的细胞状态来探索其异构体谱的差异。

异构体多样性分析显示,细胞状态特异性DEGs在18个22个定义的细胞状态中对单形与复形基因富集,平均比值比为3.6,具有统计学显著性(Fisher精确P≤0.05)(表S9)。在CM2心肌细胞中,72%具有异构体覆盖的DEGs被归类为单形,使用1个主要异构体(图5C)。在其他疾病相关细胞状态中,细胞状态特异性DEGs中单形基因的更高频率也显著,包括Cap-ang(77%)、FB2(70%)、平滑肌细胞(67%)和CD16+Mo(80%)。这些数据表明,单形基因可能倾向于与细胞状态之间的异常变化相关联,将它们与更参与跨细胞类型和心脏条件的剧烈变化的复形基因区分开来。

除了异构体多样性外,这些细胞状态还表现出独特的异构体表达谱(图5D和表S24)。在CM2中,我们观察到从异构体水平量化中α-肌动蛋白编码基因ACTA1的过表达,进一步揭示为由蛋白质编码异构体ACTA1-202(ENST00000366684)主导的单形基因(图S17A)。另一个最近与扩张型心肌病相关的CM2-特异性过表达基因MYPN显示异构体MYPN-209(ENST00000685627)的表达显著增加(图S17B)。MYPN-209由于无义介导的衰变缺乏预测的蛋白质产物,展示了减轻基因表达影响的转录后调控机制。这些结果共同揭示了剪接水平调控和异构体多样性在跨疾病细胞状态重塑中的关键作用。

讨论

心脏疾病对全球健康构成相当大的负担,越来越多地认识到替代剪接在其发病机制中的作用。然而,对转录组在异构体水平上的表征工作受到常规测序技术或批量方法局限性的制约,这些方法缺乏解析复杂细胞生态系统中全长转录本结构的分辨率。这些工作至关重要;剪接异构体在治疗应用中具有相当的重要性,包括可作为诊断、预后和治疗监测生物标志物的疾病相关异构体流行率的识别。在本研究中,我们使用最近开发的snNanoRNAseq平台在多个维度上对人类左心室中的全长剪接异构体进行了全面表征。

我们的长读长单细胞核方法成功再现了所有主要心脏细胞类型的转录组组成,证明snNanoRNAseq是分析心脏组织转录组的稳健可行方法。大量长读长在参考注释中表现出异构体的全长覆盖,能够对数千个基因在数千个细胞中的剪接异构体进行大规模表征。通过这种强大方法,我们识别了数百个基因的细胞类型特异性异构体谱差异,并报告了与每种细胞类型相关的疾病相关异构体使用,这些在常规全基因表达分析中很大程度上被遗漏。在评估终末期心力衰竭样本的全长转录组时,我们报告了伴随独特异构体使用变化的疾病相关异构体表达程序,这些变化与心肌细胞和成纤维细胞中不同细胞状态的重塑相一致。我们还报告了在几种细胞类型中捕获的数千种新型转录本,包括以前未注释的TTNMYOZ2异构体,这些对心脏功能很重要。我们的发现通过纳入与功能结果直接相关的全长剪接水平信息,补充和扩展了先前发表的心脏基因表达图谱。

我们的研究有几个局限性。由于从人类心脏(尤其是心肌细胞)获取新鲜、有活力的单细胞的挑战,心肌细胞一旦从体内移除就会迅速死亡和退化,我们仅限于分析单细胞核转录组。虽然先前的基准研究表明,细胞核转录组与全细胞转录组高度相关,但相当一部分细胞核RNA由新生转录本组成。这些前mRNA基于内含子的存在和IsoQuant处理过程中与参考注释的不完全匹配被归类为"未剪接"转录本,然而,这可能会消耗许多测序读数,导致成熟RNA的覆盖率较低。为解决这个问题,我们排除了读数覆盖率低的细胞,并应用伪批量策略,重点关注精确映射到已知异构体的读数。

此外,我们的发现反映了缺血性心脏病导致的心力衰竭。需要进行进一步研究以评估其他心力衰竭病因学中的相关性。尽管健康心脏样本是从报告正常心脏功能的捐赠者获得的,但可能存在与死亡状态相关的病理。我们也认识到,转录异质性在成人心脏的不同区域中已有明确记载。虽然我们的研究集中在左心室心肌上,但对其他心脏区域的进一步调查可能会揭示反映其独特生理特征的不同异构体景观。尽管如此,在左心室内,我们识别了与细胞类型和疾病相关的大量异构体。此外,研究DIU事件的下游效应的功能测定可能会揭示潜在的治疗开发领域,其中我们详细的细胞特异性异构体图谱将作为广泛研究社区中下游机制和转化研究的有用参考。

我们的研究为成人人类心脏中非疾病和疾病左心室的剪接异构体提供了宝贵的资源,有助于更深入地理解它们在心脏健康和发病机制中的作用。

【全文结束】

大健康
大健康