巧妙的人工智能解决方案破解蛋白质难题荣获化学诺贝尔奖Ingenious AI Solution to Protein Puzzle Wins Nobel Prize in Chemistry

环球医讯 / AI与医疗健康来源:www.sciencealert.com美国 - 英语2024-10-10 11:41:00 - 阅读时长6分钟 - 2607字
2024年诺贝尔化学奖授予Demis Hassabis、John Jumper和David Baker,他们利用机器学习解决了生物学中最大的挑战之一:预测蛋白质的3D形状并从头设计蛋白质
2024年诺贝尔化学奖蛋白质3D形状预测机器学习DeepMind蛋白质折叠疾病治疗药物开发
巧妙的人工智能解决方案破解蛋白质难题荣获化学诺贝尔奖

2024年诺贝尔化学奖表彰了Demis Hassabis、John Jumper和David Baker,他们利用机器学习攻克了生物学中最大的挑战之一:预测蛋白质的3D形状并从头设计蛋白质。今年的奖项特别之处在于,它表彰了一项起源于科技公司的研究:DeepMind,一家于2014年被谷歌收购的人工智能研究初创公司。大多数之前的化学诺贝尔奖都授予了学术界的研究人员。

尽管物理学和化学诺贝尔奖分别颁发,但2024年的获奖研究之间存在一个有趣的联系。物理学奖授予了两位奠定了机器学习基础的计算机科学家,而化学奖得主则因其利用机器学习解决生物学最大谜团之一——蛋白质如何折叠——而受到表彰。2024年的诺贝尔奖强调了这种类型的人工智能的重要性,以及当今科学常常跨越传统界限,融合不同领域以取得突破性成果。

蛋白质折叠的挑战

蛋白质是生命的分子机器。它们构成了我们身体的很大一部分,包括肌肉、酶、激素、血液、头发和软骨。蛋白质是由氨基酸分子链形成的,这些分子链根据其原子之间的相互作用形成三维结构。了解蛋白质的结构至关重要,因为它们的形状决定了其功能。

早在1972年,Christian Anfinsen因证明蛋白质的氨基酸构建块序列决定了蛋白质的形状,进而影响其功能,而获得诺贝尔化学奖。如果蛋白质折叠错误,可能无法正常工作,甚至可能导致阿尔茨海默病、囊性纤维化或糖尿病等疾病。蛋白质的整体形状取决于构成它的氨基酸的所有原子之间的微小相互作用,即吸引力和排斥力。蛋白质会扭曲并折叠成最终形状,基于成千上万次的化学相互作用。

几十年来,生物学面临的最大挑战之一就是仅根据蛋白质的氨基酸序列预测其形状。尽管研究人员现在可以预测形状,但我们仍然不理解蛋白质是如何在几微秒内操纵成特定形状并最小化所有原子间相互作用的排斥力的。为了理解蛋白质的工作原理并防止错误折叠,科学家们需要一种方法来预测蛋白质的折叠方式,但解决这个难题并非易事。

2003年,华盛顿大学生物化学家David Baker编写了Rosetta,这是一个用于设计蛋白质的计算机程序。通过该程序,他展示了可以通过设计蛋白质形状然后预测所需的氨基酸序列来逆向解决蛋白质折叠问题。这是一次巨大的飞跃,但选择的计算形状非常简单,计算过程也相当复杂。为了常规设计具有所需结构的新蛋白质,需要进行一次重大的范式转变。

机器学习新时代

机器学习是一种人工智能,其中计算机通过分析大量数据来学习解决问题的方法。它已在各个领域得到应用,从游戏、语音识别到自动驾驶汽车和科学研究。机器学习背后的思想是利用数据中的隐藏模式来回答复杂问题。

这一方法在2010年取得了巨大飞跃,当时Demis Hassabis共同创立了DeepMind,该公司旨在结合神经科学与人工智能来解决现实世界的问题。Hassabis从小就是国际象棋神童,在4岁时就引起了关注。他凭借AlphaZero迅速引起轰动,这是一种能够自学国际象棋达到超人类水平的人工智能。2017年,AlphaZero彻底击败了世界上顶级的计算机国际象棋程序Stockfish-8。AI通过自我对弈学习的能力,而不是依赖预编程策略,标志着人工智能领域的一个转折点。

不久之后,DeepMind将类似的技术应用于围棋,这是一种以其巨大复杂性而闻名的古老棋盘游戏。2016年,其AI程序AlphaGo在一场广受关注的比赛中击败了世界顶级选手李世石,令数百万人震惊。2016年,Hassabis将DeepMind的重点转向了一个新挑战:蛋白质折叠问题。在具有蛋白质科学背景的化学家John Jumper的领导下,AlphaFold项目开始了。

团队使用了一个大型的实验确定的蛋白质结构数据库来训练AI,使其能够学习蛋白质折叠的原理。结果是AlphaFold2,一种能够从蛋白质的氨基酸序列准确预测其3D结构的人工智能。这是一个重要的科学突破。AlphaFold迄今已预测了超过2亿种蛋白质的结构,基本上涵盖了科学家迄今为止测序的所有蛋白质。这个庞大的蛋白质结构数据库现在免费提供,加速了生物学、医学和药物开发的研究。

设计蛋白质以对抗疾病

了解蛋白质如何折叠和功能对于设计新药至关重要。酶是一种蛋白质,作为生化反应的催化剂,可以加速或调节这些过程。为了治疗癌症或糖尿病等疾病,研究人员通常会针对疾病途径中特定的酶。通过预测蛋白质的形状,科学家可以确定小分子(潜在的药物候选物)可能结合的位置,这是设计新药物的第一步。

2024年,DeepMind推出了AlphaFold3,这是AlphaFold程序的升级版,不仅能够预测蛋白质形状,还能识别小分子的潜在结合位点。这一进展使研究人员更容易设计出精确靶向正确蛋白质的药物。谷歌于2014年以约5亿美元的价格收购了DeepMind。Google DeepMind现已启动了一项新的业务Isomorphic Labs,与制药公司合作,利用这些AlphaFold3预测进行实际药物开发。

David Baker在2024年10月9日得知获得诺贝尔奖的消息后,与Demis Hassabis和John Jumper通电话。(Ian C. Haydon/UW Medicine Institute for Protein Design)

David Baker继续在蛋白质科学领域做出重要贡献。他在华盛顿大学的团队开发了一种基于AI的方法,称为“家族范围的幻觉”,用于从头设计全新的蛋白质。幻觉是指新的模式,在这种情况下是蛋白质,这些模式是合理的,意味着它们与AI训练数据中的模式相符。这些新蛋白质包括一种发光酶,表明机器学习可以帮助创造从未自然进化过的新型合成蛋白质。这些AI工具为设计功能性酶和其他蛋白质提供了新方法,这些蛋白质从未自然进化过。

人工智能将开启研究新篇章

Hassabis、Jumper和Baker的诺贝尔奖级成就表明,机器学习不仅是计算机科学家的工具,而且现在已成为生物学和医学未来的重要组成部分。通过解决生物学中最难的问题之一,2024年诺贝尔奖得主为药物发现、个性化医疗甚至我们对生命化学的理解开辟了新的可能性。

Marc Zimmer,康涅狄格学院化学教授

本文转载自The Conversation,采用Creative Commons许可。阅读原文。


(全文结束)

大健康
大健康