Drug developers have historically glued their attention to targeting the precise and fine-tuned protein structures underlying biological function. Yet this approach misses over 50% of the human proteome, which is highly flexible, flopping between conformations to drive a wealth of disease-related pathways, including pain signaling, cancer progression, and neurological disease. These intrinsically disordered regions (IDRs) have long been untamed by candidate drug binders, flaunting the title, “undruggable”… until now.
研究人员来自诺贝尔奖得主David Baker博士的实验室,他们开发了互补的人工智能方法,以全新的成功率和亲和力设计出针对IDRs的蛋白质结合物。这些方法采用基于氨基酸序列的方法,不需要结构信息,从而促进在新发现的治疗靶点上进行高度通用的药物发现。这项工作记录在一篇发表于《科学》杂志的论文中,标题为“无序区域结合蛋白的设计”,以及一篇尚未经过同行评审的bioRxiv预印本中。
Baker在接受GEN采访时说道:“人们越来越认识到无序蛋白质在生物学中的重要性,但设计针对它们的结合物一直非常困难。我把这称为‘针对不可成药靶点的药物开发’。这是一类我们以前无法触及的难于成药的靶点。”
Baker实验室成功靶向的多种含有IDRs的蛋白质中包括与慢性疼痛有关的阿片受体dynorphin,与乳腺癌相关的DNA修复蛋白BRCA1的一个变体,以及其设计结合物被证明可溶解与2型糖尿病相关淀粉样纤维的激素amylin。
Baker是霍华德·休斯医学研究所(HHMI)的研究员,也是华盛顿大学(UW)蛋白质设计研究所的主任。他因在蛋白质设计中开创人工智能应用的工作而获得2024年诺贝尔化学奖。近年来,他的实验室开发了RFdiffusion,这是一种基于扩散的人工智能模型,能够从头(de novo)生成蛋白质,以实现广泛的应用,包括癌症免疫疗法、酶催化、中和蛇毒,以及现在针对IDRs。
比有序蛋白质更容易
虽然传统方法试图通过动物免疫开发抗体结合物来靶向IDRs,但IDRs一旦被注射到动物体内就极易被切割和聚集。此外,以前的计算方法依赖于预先指定目标IDR的几何结构,从而限制了通用性。
预印本描述了一种以RFdiffusion为中心的方法,该方法擅长识别IDRs中的螺旋和β链二级结构以进行结合物设计。这种二级结构倾向性通过模型在蛋白质数据银行(PDB)中的已知蛋白质上的训练得以解释。生成的IDR结合物能够实现纳摩尔到皮摩尔的强亲和力,Baker实验室的博士后研究员、预印本的共同第一作者Caixuan Liu强调说:“这匹配了自然界最强的相互作用。”
相比之下,《科学》论文中描述的方法被称为“logos”,采取了以侧链为中心的方法,创建了一个识别氨基酸侧链集合的“口袋”库。RFdiffusion随后生成一个将这些口袋连接成单一结构的结合物分子。Logos为39个高度多样化的无序目标设计了结合物,并在34个案例中同样获得了皮摩尔到纳摩尔的亲和力。
Baker实验室的博士后研究员、《科学》论文的共同第一作者Kejia Wu自六年前研究生入学以来一直在研究无序蛋白质。她解释说,像AlphaFold和RFdiffusion这样的强大人工智能方法的兴起,为历史上面临瓶颈的蛋白质设计问题带来了转折点。
Wu告诉GEN:“我喜欢这个问题,因为它如此混乱。作为科学家,我们应该有动力从混乱中寻找模式。从计算蛋白质设计的角度和体外研究中,我们已经取得了很大进展。”
Baker强调,由于诱导契合的概念,设计针对无序蛋白质的结合物“几乎变得更容易”而不是有序蛋白质。鉴于IDRs的非结构特性,两种方法都能采样各种构象以识别最佳结合候选者。这一概念与有序蛋白质的固定结构限制最佳结合解决方案的数量形成对比。
Baker解释说:“即使蛋白质本身是展开的,当它与设计的结合物相互作用时,它也会采用特定的结构。结合物基本上迫使肽进入一个适合结合的构象。”
Baker实验室已将互补的IDR结合物设计工具在线提供给所有研究人员使用。下一步的研究将扩展该方法,以考虑参与调节生物功能的IDR翻译后修饰。
【全文结束】


