克利夫兰诊所和康奈尔大学的科学家设计了一种公开可用的软件和网络数据库,旨在打破识别关键蛋白质-蛋白质相互作用的障碍,以便用药物进行治疗。该计算工具被称为PIONEER(Protein-protein InteractiOn iNtErfacE pRediction)。研究人员通过在最近发表于《自然生物技术》的文章中展示了PIONEER的实用性,识别了数十种癌症和其他复杂疾病中的潜在药物靶点。
基因组研究在药物发现中至关重要,但单靠它并不总是足够的,克利夫兰诊所基因组中心主任Feixiong Cheng博士说。基于基因组数据制造药物,从发现致病基因到进入临床试验的平均时间是10到15年。“理论上,基于遗传数据制造新药是简单的:突变基因产生突变蛋白,”Cheng博士说,“我们试图创造分子来阻止这些蛋白质干扰关键的生物过程,通过阻止它们与健康蛋白质的相互作用,但在现实中,这说起来容易做起来难。”
人体中的一个蛋白质可以以多种方式与其他数百个蛋白质相互作用。这些蛋白质又可以与更多蛋白质相互作用,形成一个复杂的蛋白质-蛋白质相互作用网络,称为互作组。当致病的DNA突变引入其中时,情况变得更加复杂。一些基因可以通过多种方式突变导致同一种疾病,这意味着一种条件可能与仅由一个不同突变的蛋白质引起的多个互作组相关联。
药物开发者面临着成千上万种潜在的致病相互作用选择,而这只是在他们根据受影响蛋白质的物理结构生成列表之后。Cheng博士与康奈尔大学创新蛋白质组学中心主任Haiyuan Yu博士合作,寻求开发一种人工智能(AI)工具,帮助基因/基因组研究人员和药物开发者更轻松地识别最有前景的蛋白质-蛋白质相互作用。该团队整合了来自多个来源的大量数据,包括:
- 几乎10万名出生时带有致病突变或后来获得这些突变(通常是癌症)的个体的基因组序列。
- 超过16,000种人类蛋白质的三维物理结构,以及DNA突变如何影响这些结构的数据。
- 近300,000种不同蛋白质-蛋白质对之间的已知相互作用。
他们的数据库允许研究人员导航超过10,500种疾病的互作组,从脱发到冯·威勒布兰德病。识别出与疾病相关的突变的研究人员可以将其输入PIONEER,以获得一个按顺序排列的蛋白质-蛋白质相互作用列表,这些相互作用有助于疾病的发生,并可能通过药物进行治疗。科学家们可以通过疾病名称搜索,以获得潜在的致病蛋白质相互作用列表,然后继续进行研究。PIONEER旨在帮助几乎任何类别的生物医学研究人员,包括自身免疫、癌症、心血管、代谢、神经和肺部疾病。
该团队在实验室中验证了数据库的预测,他们对超过1,000种蛋白质进行了近3,000种突变,并测试了这些突变对近7,000种蛋白质-蛋白质相互作用对的影响。基于这些发现的初步研究已经在进行中,以开发和测试针对肺癌和子宫内膜癌的治疗方法。该团队还证明,他们的模型的蛋白质-蛋白质相互作用突变可以预测:
- 各种癌症类型的生存率和预后,包括罕见但可能致命的肉瘤。
- 大型药物基因组学数据库中的抗癌药物反应。
研究人员还实验验证了NRF2和KEAP1蛋白质之间的蛋白质-蛋白质相互作用突变可以预测肺癌中的肿瘤生长,为靶向癌症治疗的发展提供了新的靶点。“进行互作组研究所需的资源对大多数基因研究人员来说是一个重要的进入壁垒,”Cheng博士说,“我们希望PIONEER能够在计算上克服这些障碍,减轻负担,并使更多科学家能够推进新疗法的发展。”
(全文结束)


