杜克大学的生物医学工程师开发了一种基于AI的平台,可以设计短肽(即小型蛋白质),这些短肽能够结合并破坏以往被认为无法药物治疗的致病蛋白质。这项研究受到了OpenAI图像生成模型的启发,新算法可以快速优先选择用于实验测试的短肽。
该研究于1月22日发表在《科学进展》(Science Advances)杂志上。
一种治疗疾病的方法是开发能够特异性靶向并破坏驱动疾病的蛋白质的药物。有时这些关键蛋白质具有明确的结构,就像整齐折叠的折纸鹤,因此常规的小分子疗法可以轻松与其结合。但超过80%的致病蛋白质更像是杂乱无章的一团线——无序且纠缠在一起,使得标准疗法很难找到表面的口袋来附着并发挥作用。
为了绕过这个问题,研究人员探索了如何利用短肽结合并降解致病蛋白质。由于短肽是蛋白质的小版本,它们不需要表面口袋进行结合,而是可以结合到蛋白质中的各种氨基酸序列。然而,即使是这些方法也有其局限性,现有的“现成”结合剂并未设计用于附着不稳定的或过于纠缠的蛋白质结构。虽然科学家们一直在努力开发新的结合蛋白质,但这些方法仍然依赖于绘制目标蛋白质的三维结构信息,而这些信息对于无序的目标并不可用。
杜克大学生物医学工程助理教授Pranam Chatterjee和他的团队从生成式大语言模型(LLMs)中获得灵感,创建了解决方案。他们的工具名为PepPrCLIP,即通过CLIP进行短肽优先排序。该工具的第一部分PepPr使用一个生成算法,该算法经过大量天然蛋白质序列训练,设计具有指定特征的新“引导”蛋白质。CLIP作为平台的第二部分,利用OpenAI最初开发用于匹配图像和相应标题的算法框架,测试并筛选这些短肽中哪些能与目标蛋白质匹配。这里,CLIP模型仅需目标序列。
“OpenAI的CLIP算法连接语言与图像。如果你有文本写着‘狗’,你应该得到一张狗的图片。我们将其训练为匹配短肽和蛋白质。PepPr生成短肽,我们的改进版CLIP算法将筛选这些短肽,并告诉我们哪些会是好的匹配。”
在与RFDiffusion(一种使用目标3D结构生成短肽的现有平台)的比较中,PepPrCLIP更快,并且几乎总是能找到更好的目标蛋白质匹配。为了评估PepPrCLIP对有序和无序蛋白质目标的效果,Chatterjee及其团队与来自杜克大学医学院、康奈尔大学和桑福德伯纳姆普雷比斯医学发现研究所的研究人员合作进行了实验测试。
在第一次测试中,研究团队展示了PepPrCLIP生成的短肽能够有效结合并抑制UltraID的活性,UltraID是一种相对简单且稳定的酶蛋白。接下来,他们使用PepPrCLIP设计了能够附着于β-catenin的短肽,β-catenin是一种参与多种癌症信号传导的无序复杂蛋白质。研究团队生成了六种CLIP指示可能结合该蛋白质的短肽,并证实其中四种可以有效地结合并降解目标。通过摧毁蛋白质,他们可以减缓癌细胞信号传导。
在最复杂的测试中,研究团队设计了能够结合高度无序蛋白质的短肽,这种蛋白质与滑膜肉瘤有关,这是一种罕见且侵袭性强的癌症,主要影响儿童和年轻人。Chatterjee形容:“它像一碗意大利面,是世界上最无序的蛋白质。”
研究团队通过将短肽放入滑膜肉瘤细胞中测试了10种设计。他们观察到,PepPrCLIP设计的短肽能够像处理更简单的目标一样结合并降解蛋白质。如果他们可以摧毁这种蛋白质,就有机会为以前无法药物治疗的癌症开发疗法。
除了继续改进平台外,Chatterjee和他的团队计划与医疗和行业专业人士合作,开始为由不稳定蛋白质引起的疾病(如亚历山大病,一种致命的神经系统疾病,主要影响儿童,以及不同类型的癌症)创造可用于新疗法的短肽。
“这些复杂、无序的蛋白质使许多癌症和疾病实际上无法药物治疗,因为我们无法设计出结合这些蛋白质的分子。”Chatterjee说,“但PepPrCLIP表明它可以处理最复杂的蛋白质,这为临床应用带来了许多令人兴奋的可能性。”
(全文结束)


