自然界擅长设计蛋白质,但科学家们做得更好。然而,人工智能有望将蛋白质改进许多倍。这些“设计蛋白”在医学上的应用范围从创建更精确的抗体治疗自身免疫疾病或癌症,到更有效的疫苗对抗病毒。其应用可能扩展到医学之外,例如种植更好的作物,使其更有营养或吸收更多的二氧化碳。马萨诸塞州总医院布里格姆和贝丝以色列女执事医疗中心(BIDMC)的研究人员开发了一种名为EVOLVEpro的人工智能工具,这可能代表了蛋白质工程的一大进步。在《科学》杂志上发表的一篇论文中,研究团队展示了该工具通过优化六种具有不同应用的蛋白质,使其更加稳定、精确和高效的能力。
“这种工具的强大之处在于我们不受进化的限制。利用人工智能,我们可以选择优化蛋白质以满足所需的方式,”共同资深作者Omar Abudayyeh博士说,他是马萨诸塞州总医院布里格姆基因与细胞疗法研究所和布里格姆妇女医院医学系工程医学部门的研究员。“我们可以设计一种更好、更快、更强的蛋白质。我们可以设计它以更高效地结合目标,从而改善疗法或提高其功能。只要我们能测量,我们就能改进。”
蛋白质工程的概念并不新鲜,但人工智能和大型语言模型的出现开始彻底改变这一领域。蛋白质语言模型(PLMs)可以学习蛋白质的“语法”,从大型基因组数据库中读取蛋白质序列,并提供可以按照科学家指定方式改进蛋白质的建议。与新的大型语言模型类似,EVOLVEpro作为先前模型的附加层,可以在响应前进行推理和提供更多思考。
“近年来,蛋白质建模取得了进展,我们想知道是否可以利用大型语言模型来预测更好的蛋白质序列,”共同资深作者Jonathan S. Gootenberg博士说,他是BIDMC病毒学和疫苗研究中心、马萨诸塞州总医院布里格姆基因与细胞疗法研究所和哈佛医学院的成员。“我们的结果一致显示了这个工具的工作效果有多好。我们选择了两种临床上相关的抗体——要么已经在使用,要么接近人类使用——发现通过EVOLVEpro,我们可以设计出结合更好且表达更好的抗体。通常情况下,你可以在一个结果上做得很好,但在这里我们看到了两个方面的改进。”
像这样的研究展示了基因和细胞疗法技术的进步如何有可能改变医学。马萨诸塞州总医院布里格姆基因与细胞疗法研究所(GCTI)成立于2022年,旨在推动靶向、变革性治疗方法的发现和发展,这些方法有潜力治愈疾病或阻止其进展。该研究所联合了500多名致力于推进基因和细胞疗法以进行首次人体临床试验的最终目标,即拯救患者生命的治疗。
《科学》杂志论文的研究团队由第一作者Kaiyi Jiang和Zhaoqing Yan(来自马萨诸塞州总医院布里格姆基因与细胞疗法研究所)以及Matteo Di Bernardo(来自麻省理工学院)领导,他们使用EVOLVEpro设计了六种蛋白质。研究人员发现,EVOLVEpro设计的两种单克隆抗体对目标的结合能力提高了30倍。
“我们预计这只是EVOLVEpro的开始,随着时间的推移,它将继续改进,并可用于各种蛋白质工程应用,”Jiang说。“这项技术标志着一个新时代的开始,在这个时代,我们可以设计蛋白质不仅匹配自然的设计,还可以解决自然从未面临过的挑战——从创造更精确的药物到开发可以帮助应对气候变化和食品安全问题的蛋白质。”
微型CRISPR核酸酶的基因编辑效率提高了五倍。一种用于基因编辑的蛋白质,称为prime编辑器,在将序列插入基因组的不同部分时效率提高了两倍。一种称为Bxb1整合酶的蛋白质在细胞中插入DNA以实现可编程基因整合应用时效率提高了四倍。一种用于RNA生产的T7 RNA聚合酶在制造准确的RNA拷贝方面效率提高了100倍,这对于制造mRNA疗法或疫苗非常重要。
“我们预计这只是EVOLVEpro的开始,它将继续改进,并可用于各种蛋白质工程应用,”Jiang说。“这项技术标志着一个新时代的开始,在这个时代,我们可以设计蛋白质不仅匹配自然的设计,还可以解决自然从未面临过的挑战——从创造更精确的药物到开发可以帮助应对气候变化和食品安全问题的蛋白质。”
(全文结束)


