系统性硬化症(SSc)是一种严重的自身免疫性疾病,具有复杂的遗传原因。尽管已经识别出一些遗传因素,但仍有许多未知因素阻碍了针对性治疗的发展。在《风湿病学年鉴》上发表的一项新研究中,贝勒医学院和合作机构的研究人员使用互补的方法,结合外显子测序和进化行动机器学习,来识别SSc中的蛋白质变化及其相关机制。
先前的全基因组关联研究(GWAS)分析了常见遗传变异的频率,发现最强的遗传贡献者位于第六染色体的人类白细胞抗原(HLA)区域。在这项研究中,由Shamika Ketkar博士领导的研究人员对来自德克萨斯大学休斯顿健康科学中心的硬皮病家族登记库和DNA存储库的2,559名SSc患者和893名健康对照者的外显子测序数据进行了GWAS分析,旨在发现新的基因和罕见变异,这些变异可能对SSc的风险有所贡献。
“真正让我们惊讶和兴奋的是发现了并验证了MICB,这是一个位于HLA区域内但独立于经典HLA基因作用的基因。此前并未有证据表明MICB与系统性硬化症有关,其发现代表了一个新的遗传贡献者和潜在的治疗靶点。”Ketkar说,她是贝勒医学院分子和人类遗传学系的助理教授。
西班牙的合作研究者们利用之前发布的欧洲GWAS数据(包括近10,000个病例)进一步验证了这一发现,从而加强了该发现的重要性。在贝勒医学院,Olivier Lichtarge博士的实验室使用其进化行动-机器学习(EAML)框架分析了外显子测序数据,并优先考虑了具有高影响变异且预测为SSc的基因。结果再次指向了MICB,以及第六染色体上的其他基因如NOTCH4,以及在干扰素信号通路(免疫系统的关键途径)中富集的稀有错义变异基因,包括IFI44L和IFIT5。
“通过我们的机器学习框架,我们不仅识别出变异发生的频率,还利用所有物种的进化数据,评估变异对蛋白质功能破坏的可能性,最终影响患者。”Lichtarge说,他是Cullen主席及分子和人类遗传学、生物化学和分子生物学及药理学教授。“我们之前在具有更大基因组数据集的疾病中使用过这种方法,如阿尔茨海默病和心脏病,在这项研究中,我们展示了它在具有较小患者数据集的复杂疾病中的有效性。”
为了理解研究中识别出的遗传变异的功能影响,研究人员整合了公开可用的单细胞RNA测序数据,从SSc皮肤活检中解析风险基因的细胞类型特异性表达模式。他们还使用全血数据集进行了表达数量性状位点(eQTL)分析,以建立疾病相关变异与转录组变化之间的调控联系。发现MICB和NOTCH4在成纤维细胞和内皮细胞中表达,这两种细胞类型在纤维化和血管病变(SSc的关键临床特征)中起着核心作用。这些互补分析确认了已识别风险基因的功能调控效应。
“要解决像SSc这样的复杂疾病,我们需要结合不同的方法和机器学习来分析大型DNA、RNA和蛋白质数据集,以发现隐藏的治疗靶点。”通讯作者Brendon Lee博士说,他是贝勒医学院分子和人类遗传学教授、主席及Robert和Janice McNair讲席教授。
其他对该研究做出贡献的作者包括Hongzheng Dai、Lindsay Burrage、David Murdock、Brian Dawson、Marialbert Acosta-Herrera、Martin Kerick、Javier Martin、Kevin Wilhelm、Jennifer Kay Asmussen、Regeneron Genetics Center、Shervin Assassi和Maureen D. Mayes。他们分别隶属于以下机构之一:贝勒医学院、休斯顿UTHealth麦戈文医学院、洛佩兹-尼赫拉寄生虫学和生物医学研究所和再生元制药公司。
这项工作得到了美国国立卫生研究院关节炎、肌肉骨骼和皮肤病研究所、德克萨斯大学健康科学中心和国防部国会指导的医学研究计划的资助。详见出版物中的完整资助列表。
(全文结束)


