自然界在设计蛋白质方面表现出色,但科学家们做得更好。然而,人工智能有望将蛋白质改进许多倍。这些“设计蛋白”的医学应用范围从创建更精确的抗体用于治疗自身免疫疾病或癌症到更有效的病毒疫苗。此外,应用可能扩展到医学以外的领域,例如,种植更好的作物,使其更具营养或能吸收更多大气中的二氧化碳。马萨诸塞州总医院布里格姆分院(Mass General Brigham)和贝丝以色列女执事医疗中心(Beth Israel Deaconess Medical Center, BIDMC)的研究人员开发了一种名为EVOLVEpro的人工智能工具,这可能代表了蛋白质工程领域的重大飞跃。在《科学》杂志上发表的一篇论文中,研究团队展示了该工具通过优化六种具有不同应用的蛋白质,使蛋白质更加稳定、精确和高效的能力。
“这种工具的强大之处在于我们不受进化的限制。利用人工智能,我们可以选择优化蛋白质以满足任何所需的方式,”共同资深作者Omar Abudayyeh博士说。他是马萨诸塞州总医院布里格姆分院基因与细胞治疗研究所和医学系工程医学部的研究员,同时也是哈佛医学院的助理教授。“我们可以设计出更好、更快、更强的蛋白质。我们可以设计它更有效地结合目标,以改善疗法或提高其功能。只要我们能测量它,我们就能改进它。”
蛋白质工程的概念并不新鲜,但人工智能和大型语言模型的出现开始彻底改变这一领域。蛋白质语言模型(PLMs)可以学习蛋白质的“语法”,从大型基因组数据库中读取蛋白质序列,并提供可以按科学家指定方式改进蛋白质的建议。类似于新的大型语言模型,EVOLVEpro作为先前模型的附加层,可以进行推理并在响应前提供更多思考。
“近年来,蛋白质建模已经取得进展,我们想知道是否现在可以使用大型语言模型来预测更好的蛋白质序列,”共同资深作者Jonathan S. Gootenberg博士说。他是BIDMC病毒学和疫苗研究中心的成员,也是马萨诸塞州总医院布里格姆分院基因与细胞治疗研究所的成员,同时还是哈佛医学院的教职员工。“我们的结果一致显示了这个工具的工作效果有多好。我们选择了两种临床上相关的抗体——已经使用或接近人类使用的抗体——发现通过EVOLVEpro,我们可以设计出结合能力更强且表达更好的抗体。通常情况下,你可以在其中一个结果上表现良好,但在这里我们看到了两个方面的改进。”
像这样的研究展示了基因和细胞治疗技术的进步如何有可能改变医学。马萨诸塞州总医院布里格姆分院基因与细胞治疗研究所(GCTI)于2022年成立,旨在推动具有潜在治愈疾病或阻止疾病进展的靶向、变革性治疗方法的发现和开发。该研究所汇集了500多名致力于推进基因和细胞治疗的临床试验,最终为患者提供挽救生命的治疗方法的研究人员和临床医生。
《科学》杂志论文的研究团队由第一作者Kaiyi Jiang、Zhaoqing Yan(马萨诸塞州总医院布里格姆分院基因与细胞治疗研究所)和Matteo Di Bernardo(麻省理工学院)领导,使用EVOLVEpro设计了六种蛋白质。研究人员发现,EVOLVEpro设计的两种单克隆抗体结合目标的能力提高了30倍。一种微型CRISPR核酸酶的基因编辑效率提高了五倍。一种用于基因编辑的蛋白质,称为先导编辑器,在基因组的不同部分插入序列的能力提高了两倍。一种用于可编程基因整合应用的蛋白质Bxb1整合酶插入DNA的效率提高了四倍,而一种用于RNA生产的蛋白质T7 RNA聚合酶生成准确的RNA拷贝的能力提高了100倍,这对于制造mRNA疗法或疫苗非常重要。
“我们预计这只是EVOLVEpro的开始,随着时间的推移,它将继续改进,并可用于各种蛋白质工程应用,”Jiang说。“这项技术标志着一个新时代的开始,我们可以设计蛋白质不仅是为了匹配自然的设计,而是为了应对自然从未面临过的挑战——从创造更精确的药物到开发有助于解决气候变化和食品安全问题的蛋白质。”
作者还包括:Gootenberg、Abudayyeh、Jiang和Yan,以及马萨诸塞州总医院布里格姆分院的Samantha R. Sgrizzi、Lukas Villiger、Alisan Kayabolen和Josephine K. Carscadden。其他作者包括Matteo Di Bernardo、Byungji Kim、Masahiro Hiraizumi和Hiroshi Nishimasu。
披露:Gootenberg、Abudayyeh、Jiang、Di Bernardo、Villiger和Yan已就相关工作申请了专利(临时专利#63/509,139)。Gootenberg和Abudayyeh是Sherlock Biosciences、Tome Biosciences、Doppler Biosciences和Circle Labs的联合创始人。目前没有公司参与商业化这项技术。
资金来源:美国国立卫生研究院(1R21-AI149694, R01-EB031957, 1R01GM148745, R56-HG011857, 和 R01AG074932),K. Lisa Yang和Hock E. Tan神经科学分子治疗中心;激励基金;囊性纤维化基金会先锋基金;Google Ventures;Pivotal Life Sciences;MGB基因与细胞治疗研究所;Yosemite基金;日本学术振兴会(21H05281 和 22H00403),武田医学研究基金会,井上科学研究所,日本科学技术振兴机构CREST(JPMJCR19H5 和 JPMJCR23B6)。
引用论文:Jiang K等. “基于蛋白质语言模型的快速计算机辅助定向进化(EVOLVEpro)”《科学》DOI: 10.1126/science.adr6006
(全文结束)


