新的AI工具可以预测数百种疾病中的蛋白质-蛋白质相互作用突变。该工具预测单个DNA突变如何影响人类蛋白质-蛋白质互作组,利用创新的AI技术支持疾病诊断和药物发现。这项研究经过同行评审,由克利夫兰诊所和康奈尔大学的科学家设计了一种公开可用的软件和网络数据库,旨在打破识别关键蛋白质-蛋白质相互作用以进行药物治疗的障碍。计算工具称为PIONEER(蛋白质-蛋白质相互作用界面预测)。
研究人员通过在最近发表于《自然生物技术》杂志的文章中确定数十种癌症和其他复杂疾病的潜在药物靶点,展示了PIONEER的实用性。基因组研究是药物发现的关键,但仅靠它并不总是足够的,克利夫兰诊所基因组中心的主任Feixiong Cheng博士说。根据基因组数据制造新药理论上是简单的:突变基因产生突变蛋白。我们尝试创造分子来阻止这些蛋白干扰关键的生物过程,通过阻止它们与健康蛋白的相互作用,但在现实中,这说起来容易做起来难。
人体内的一个蛋白可以以多种方式与其他数百个蛋白相互作用。这些蛋白又可以与更多蛋白相互作用,形成一个复杂的蛋白质-蛋白质相互作用网络,称为互作组,Cheng博士解释道。当引入致病DNA突变时,情况变得更加复杂。有些基因可以通过多种方式突变导致同一种疾病,这意味着一种疾病可能与仅由一个不同突变蛋白引起的多个互作组相关联。
药物开发者面临数万个潜在的致病相互作用供选择,而这只是在他们基于受影响蛋白的物理结构生成列表之后。Cheng博士寻求开发一种人工智能(AI)工具,帮助基因/基因组研究人员和药物开发者更容易地识别最有前景的蛋白质-蛋白质相互作用,与康奈尔大学创新蛋白质组学中心主任Haiyuan Yu博士合作。该团队整合了来自多个来源的大量数据,包括:
- 几乎10万名个体的基因组序列,这些人要么天生带有致病突变,要么后来获得这些突变(通常是癌症)。
- 超过16,000种人类蛋白的三维物理结构,以及DNA突变如何影响这些结构的数据。
- 近300,000种不同蛋白质-蛋白质对之间的已知相互作用。
他们的数据库使研究人员能够浏览超过10,500种疾病的互作组,从脱发到冯·维勒布兰德病。识别出与疾病相关的突变的研究人员可以将其输入PIONEER,以获得一个按重要性排名的蛋白质-蛋白质相互作用列表,这些相互作用有助于疾病并可能通过药物治疗。科学家可以通过疾病名称搜索,以获得一个潜在的致病蛋白质相互作用列表,然后继续研究。PIONEER旨在帮助几乎任何类别的生物医学研究人员,包括自身免疫、癌症、心血管、代谢、神经和肺部疾病。
该团队在实验室中验证了数据库的预测,他们在1,000多种蛋白上进行了近3,000种突变,并测试了这些突变对近7,000种蛋白质-蛋白质相互作用对的影响。基于这些发现的初步研究已经开始,以开发和测试肺癌和子宫内膜癌的治疗方法。该团队还证明,他们的模型中的蛋白质-蛋白质相互作用突变可以预测:
- 各种癌症类型的生存率和预后,包括罕见但可能致命的肉瘤。
- 大型药物基因组学数据库中的抗癌药物反应。
研究人员还实验验证了NRF2和KEAP1蛋白之间的蛋白质-蛋白质相互作用突变可以预测肺癌中的肿瘤生长,为靶向癌症治疗的发展提供了新的目标。“进行互作组研究所需的资源对大多数基因研究人员来说是一个重要的进入障碍,”Cheng博士说,“我们希望PIONEER能够在计算上克服这些障碍,减轻负担,并赋予更多科学家推进新疗法的能力。”
关于这项研究:本研究有五位共同第一作者,他们贡献相同:Dapeng Xiong博士(康奈尔大学)、Yunguang Qiu博士(克利夫兰诊所)、Junfei Zhao博士(哥伦比亚大学)、Yadi Zhou博士(克利夫兰诊所)和Dongjin Lee博士(康奈尔大学)。该研究部分由美国国立衰老研究所(R01AG084250、R56AG074001、U01AG073323、R01AG066707、R01AG076448、R01AG082118、RF1AG082211和R21AG083003)和美国国立神经疾病和中风研究所(RF1NS133812)资助。该工作还得到了已故Charis Eng博士的支持,她是克利夫兰诊所癌症基因组医学Sondra J.和Stephen R. Hardis主席。Cheng博士希望将这篇论文献给Eng博士的纪念,她作为基因组医学研究所创始主席,毕生致力于人类遗传学、个性化基因组医疗研究和指导工作。
(全文结束)


