2024年诺贝尔化学奖授予了Demis Hassabis、John Jumper和David Baker,以表彰他们利用机器学习解决了生物学中最大的挑战之一:预测蛋白质的3D形状和从头设计蛋白质。
今年的奖项尤为突出,因为它表彰了一项起源于科技公司的研究:DeepMind,这是一家由谷歌在2014年收购的人工智能研究初创公司。大多数以前的化学诺贝尔奖都颁给了学术界的研究人员。许多获奖者后来成立了初创公司,进一步扩展和商业化他们的开创性工作——例如CRISPR基因编辑技术和量子点——但研究的全过程并非在商业领域完成。
虽然物理学和化学诺贝尔奖分别颁发,但2024年的获奖研究之间存在一个有趣的联系。物理学奖授予了两位计算机科学家,他们奠定了机器学习的基础,而化学奖得主则因其利用机器学习解决生物学最大谜团之一——蛋白质如何折叠——而受到表彰。2024年的诺贝尔奖强调了这种类型的人工智能的重要性,以及当今科学常常跨越传统界限,融合不同领域以取得突破性成果的能力。
蛋白质折叠的挑战
蛋白质是生命的分子机器。它们构成了我们身体的重要部分,包括肌肉、酶、激素、血液、头发和软骨。了解蛋白质的结构至关重要,因为它们的形状决定了其功能。早在1972年,Christian Anfinsen就因证明蛋白质的氨基酸序列决定了其形状,从而影响其功能而获得诺贝尔化学奖。如果蛋白质折叠错误,它可能无法正常工作,甚至可能导致阿尔茨海默病、囊性纤维化或糖尿病等疾病。
蛋白质的整体形状取决于其构成氨基酸的所有原子之间的微小相互作用,即吸引力和排斥力。有些原子希望在一起,有些则不想。蛋白质通过这些化学相互作用的数千次作用,扭曲并折叠成最终形状。几十年来,生物学面临的最大挑战之一就是仅凭氨基酸序列预测蛋白质的形状。尽管研究人员现在可以预测形状,但我们仍然不理解蛋白质如何在几微秒内进行特定的折叠并最小化所有原子间相互作用的排斥力。
为了理解蛋白质的工作原理并防止错误折叠,科学家们需要一种方法来预测蛋白质的折叠方式,但这并不是一个容易解决的问题。2003年,华盛顿大学生物化学家David Baker编写了Rosetta,这是一个用于设计蛋白质的计算机程序。他展示了可以通过设计蛋白质形状并预测所需的氨基酸序列来逆向解决蛋白质折叠问题。这是一个巨大的飞跃,但选择的形状简单,计算复杂。要常规设计具有所需结构的新蛋白质,需要一次重大的范式转变。
机器学习新时代
机器学习是一种人工智能,其中计算机通过分析大量数据来学习解决问题的方法。它已被应用于各个领域,从游戏、语音识别到自动驾驶汽车和科学研究。机器学习背后的思想是利用数据中的隐藏模式来回答复杂问题。
这一方法在2010年取得了巨大进展,当时Demis Hassabis共同创立了DeepMind,这是一家旨在结合神经科学与人工智能以解决现实世界问题的公司。Hassabis在4岁时就是国际象棋神童,他凭借AlphaZero迅速引起关注,这是一种自学国际象棋达到超人类水平的人工智能。2017年,AlphaZero彻底击败了世界顶级计算机国际象棋程序Stockfish-8。该人工智能能够从自己的游戏中学习,而不是依赖预编程策略,这标志着人工智能领域的转折点。
不久之后,DeepMind将类似的技术应用于围棋,这是一项以其极大复杂性而闻名的古老棋盘游戏。2016年,其人工智能程序AlphaGo在一场备受瞩目的比赛中击败了世界顶级选手李世石,令数百万人震惊。
2016年,Hassabis将DeepMind的焦点转向了一个新的挑战:蛋白质折叠问题。在John Jumper的领导下,这位具有蛋白质科学背景的化学家启动了AlphaFold项目。团队使用一个包含实验确定的蛋白质结构的大数据库来训练人工智能,使其学习蛋白质折叠的原理。结果是AlphaFold2,一种可以从氨基酸序列准确预测蛋白质3D结构的人工智能。
这是一个重要的科学突破。自那时起,AlphaFold已经预测了超过2亿个蛋白质的结构——几乎涵盖了科学家迄今测序的所有蛋白质。这个庞大的蛋白质结构数据库现已免费提供,加速了生物学、医学和药物开发的研究。
设计蛋白质以对抗疾病
了解蛋白质如何折叠和功能对于设计新药至关重要。酶是一种蛋白质,作为生化反应的催化剂,可以加速或调节这些过程。为了治疗癌症或糖尿病等疾病,研究人员通常会针对疾病途径中的特定酶。通过预测蛋白质的形状,科学家可以确定小分子——潜在的药物候选物——可能与其结合的位置,这是设计新药物的第一步。
2024年,DeepMind推出了AlphaFold3,这是AlphaFold程序的升级版,不仅能够预测蛋白质形状,还能识别小分子的潜在结合位点。这一进步使研究人员更容易设计精确靶向正确蛋白质的药物。谷歌于2014年以约5亿美元的价格收购了DeepMind。Google DeepMind现已启动了一项新业务Isomorphic Labs,与制药公司合作,利用这些AlphaFold3预测进行实际药物开发。
David Baker继续在蛋白质科学领域做出重大贡献。他的团队在华盛顿大学开发了一种基于人工智能的方法,称为“家族广泛幻觉”,用这种方法设计了全新的蛋白质。幻觉是指新的模式——在这种情况下是蛋白质——这些模式是合理的,意味着它们与人工智能训练数据中的模式相符。这些新蛋白质包括一种发光酶,表明机器学习可以帮助创造从未自然进化过的合成蛋白质。这些人工智能工具提供了新的方法来设计自然界中不可能存在的功能性酶和其他蛋白质。
人工智能将开启研究新篇章
Hassabis、Jumper和Baker的诺贝尔奖成就表明,机器学习不仅是计算机科学家的工具——它现在已成为生物学和医学未来的重要组成部分。通过解决生物学中最困难的问题之一,2024年诺贝尔奖得主为药物发现、个性化医疗乃至我们对生命化学的理解开辟了新的可能性。
Marc Zimmer没有为任何可能从本文受益的公司或组织工作、咨询、持有股份或接受资金,除了他的学术职务外,他没有披露任何相关关系。
(全文结束)


