得克萨斯大学奥斯汀分校的研究人员开发出的一种新的人工智能模型为医学中更有效和低毒性的治疗以及新的预防策略铺平了道路。该人工智能模型通过利用自然界进化过程中的底层逻辑,为基于蛋白质的疗法和疫苗的设计提供信息。
被称为 EvoRank 的人工智能进展为人工智能如何更广泛地为生物医学研究和生物技术带来颠覆性变化提供了一个新的、切实的例子。科学家们在国际机器学习会议上介绍了这项工作,并在《自然通讯》上发表了一篇相关论文,内容是关于利用更广泛的人工智能框架来识别蛋白质中的有用突变。
设计更好的基于蛋白质的生物技术的一个主要障碍是拥有足够的关于蛋白质的实验数据,以充分训练人工智能模型来理解特定蛋白质的工作方式,从而知道如何为特定目的对其进行改造。EvoRank 的关键见解是利用进化在漫长时间内产生的数百万种蛋白质的自然变异,并提取生物技术挑战可行解决方案所需的潜在动态。
计算机科学研究科学家、深度蛋白质小组的联合负责人丹尼尔·迪亚兹(Daniel Diaz)说:“大自然已经进化蛋白质达 30 亿年,变异或交换氨基酸,并保留对生物有益的那些。EvoRank 学习如何对我们周围观察到的进化进行排序,本质上是提炼决定蛋白质进化的原则,并利用这些原则指导新的基于蛋白质的应用的开发,包括药物开发和疫苗,以及广泛的生物制造目的。”
得克萨斯大学奥斯汀分校是美国国内人工智能研究的领先项目所在地之一,并设有由计算机科学教授亚当·克利万斯(Adam Klivans)领导的由美国国家科学基金会资助的机器学习基础研究所(IFML),他也是深度蛋白质小组的联合负责人。今天,高级研究项目局卫生署宣布了一项涉及深度蛋白质和疫苗制造商杰森·麦克莱伦(Jason McLellan)的资助奖励,麦克莱伦是得克萨斯大学分子生物科学教授,与拉霍亚免疫学研究所合作。得克萨斯大学的团队将获得近 250 万美元,用于开始将人工智能应用于蛋白质工程研究,以开发对抗疱疹病毒的疫苗。
克利万斯说:“设计具有天然蛋白质所没有的能力的蛋白质是生命科学中反复出现的重大挑战。这也恰好是生成式人工智能模型所擅长的任务,因为它们可以合成大量已知生物化学的数据库,然后生成新的设计。”
与谷歌 DeepMind 的 AlphaFold 不同,后者根据每种蛋白质的氨基酸序列应用人工智能来预测蛋白质的形状和结构,深度蛋白质小组的人工智能系统建议如何最好地对蛋白质进行改变以实现特定功能,例如提高蛋白质开发成新技术的容易程度。
麦克莱伦的实验室已经根据人工智能生成的设计合成了不同版本的病毒蛋白质,然后测试了它们的稳定性和其他特性。
麦克莱伦说:“这些模型提出了我们从未想过的替代方案。它们有效,但不是我们预测的东西,所以它们实际上找到了一些新的稳定空间。”
蛋白质疗法通常副作用较少,比替代品更安全、更有效,目前估计 4000 亿美元的全球产业在未来十年有望增长 50%以上。然而,开发一种基于蛋白质的药物缓慢、昂贵且风险高。从药物设计到完成临床试验的十多年旅程估计需要 10 亿美元或更多;即便如此,一家公司的新药获得美国食品和药物管理局批准的几率仅约为十分之一。更重要的是,为了在治疗中有用,蛋白质通常需要进行基因工程,例如,以确保其稳定性或使其达到药物开发所需的产量——而实验室中繁琐的反复试验传统上决定了此类基因工程决策。
如果 EvoRank 以及它所建立的相关得克萨斯大学创建的框架 Stability Oracle 被商业化改编,行业将有机会从药物开发中节省时间和费用,并更快地获得更好的设计路线图。
使用现有的天然蛋白质序列数据库,创建 EvoRank 的研究人员基本上排列了出现在不同生物体(从海星到橡树到人类)中的相同蛋白质的不同版本,并对它们进行了比较。在蛋白质的任何给定位置,可能有几种不同的氨基酸,进化发现它们是有用的,例如,自然选择酪氨酸的时间为 36%,组氨酸为 29%,赖氨酸为 14%——更重要的是永远不会选择亮氨酸。利用这一现有数据的金矿揭示了蛋白质进化的潜在逻辑。研究人员可以排除进化表明会导致蛋白质功能丧失的选项。该团队利用所有这些来训练新的机器学习算法。基于持续的反馈,该模型了解在过去进化蛋白质时自然选择了哪种氨基酸,并基于自然界中什么是合理的和什么不是来形成其理解。
迪亚兹接下来计划开发一个“多列”版本的 EvoRank,它可以评估同时发生的多个突变如何影响蛋白质的结构和稳定性。他还想为预测蛋白质的结构与其功能的关系建立新的工具。
除了克利万斯和迪亚兹,计算机科学研究生龚程跃(Chengyue Gong)和得克萨斯大学校友詹姆斯·M·洛伊(James M. Loy)共同撰写了这两篇作品。陈天龙(Tianlong Chen)和刘强(Qiang Liu)也为 EvoRank 做出了贡献;杰弗里·欧阳 - 张(Jeffrey Ouyang-Zhang)、大卫·杨(David Yang)、安德鲁·D·埃林顿(Andrew D. Ellington)和亚历克斯·G·迪马基斯(Alex G. Dimakis)也为 Stability Oracle 做出了贡献。该研究由美国国家科学基金会、国防威胁降低局和韦尔奇基金会资助。
(全文结束)


