由谷歌AI研究实验室DeepMind创建的深度学习机器AlphaFold,已经在改变我们对健康和疾病背后分子生物学的理解。2024年诺贝尔化学奖的一半授予了美国华盛顿大学的大卫·贝克(David Baker),另一半则共同授予了伦敦谷歌DeepMind的德米斯·哈萨比斯(Demis Hassabis)和约翰·J·詹珀(John M. Jumper)。如果你还没有听说过AlphaFold,可能很难理解它对研究人员来说有多么重要。但作为该软件的测试员,我亲身体验到了这项技术如何在几分钟内揭示不同蛋白质的分子结构,而这些结构在实验室实验中可能需要数月甚至数年的时间来解析。
阅读更多:谷歌DeepMind创始人因解锁蛋白质形状的AI获得诺贝尔化学奖
这项技术可能会为革命性的新治疗和药物铺平道路。但首先,重要的是要了解AlphaFold的作用。蛋白质是由一系列分子珠(氨基酸)组成的,这些氨基酸来自人体内的20种不同氨基酸。这些珠子形成一条长链,折叠成对蛋白质功能至关重要的机械形状。它们的序列由DNA决定。虽然DNA研究使我们知道构建大多数蛋白质的珠子顺序,但一直难以预测这条链如何折叠成三维结构。
这些蛋白质结构支撑着所有的生物学。科学家们研究它们的方式就像你拆开钟表来理解其工作原理一样。理解各个部分,然后组合成整体:人体也是如此。蛋白质非常微小,每个细胞中有数十亿个蛋白质。这使得几十年来,唯一了解它们形状的方法是通过繁琐的实验方法——这些研究可能需要数年时间。
在我的职业生涯中,我和许多其他科学家一样,一直在从事这样的研究。每次我们解决一个蛋白质结构,我们都会将其存入一个全球数据库——蛋白质数据银行(Protein Data Bank),任何人都可以免费使用。
AlphaFold是基于这些结构进行训练的,其中大多数结构是通过X射线晶体学发现的。在这种技术中,蛋白质会在数千种不同的化学状态下进行测试,温度、密度和pH值各不相同。研究人员使用显微镜确定每种蛋白质在特定条件下排列的方式,然后用X射线照射这些排列,以确定蛋白质中原子的空间排列。
经过这些结构的训练,AlphaFold现在可以以前所未有的速度预测蛋白质结构。我在90年代末开始我的职业生涯时,曾使用核磁共振(NMR)光谱技术通过蛋白质核的磁性特性来解析蛋白质结构。这种方法类似于MRI扫描仪,由于某些技术限制,已经开始失宠,但现在由于AlphaFold的出现,又重新受到关注。
NMR是少数几种可以探测运动中的分子的技术之一,而不是将它们固定在晶体或电子显微镜网格中。2024年3月,DeepMind的研究人员联系了我,让我测试即将发布的最新版AlphaFold3。我从未玩过游戏,但当我获得访问权限后,我立即沉迷于尝试各种分子组合,一连几个小时。
除了闪电般的速度,这个新版本还引入了包括更大、更多样化的分子(如DNA和金属)以及修改氨基酸以模拟细胞内化学信号的机会。我们的实验室在伦敦国王学院使用X射线晶体学预测了一种由两种细菌蛋白形成的结构,这些蛋白在相互作用时与医院超级细菌有松散关系。以前的AlphaFold版本可以预测单个组件,但无法正确预测复合体——然而,这个新版本在首次尝试中就解决了这个问题。
理解蛋白质的运动部分和动力学是下一个前沿,现在我们已经可以用AlphaFold预测静态蛋白质形状。蛋白质有各种各样的形状和大小,可以是刚性的或柔性的,也可以是由整齐的结构单元通过弯曲的环连接而成。动力学对蛋白质功能至关重要。正如另一位诺贝尔奖得主理查德·费曼(Richard Feynman)所说:“所有生物所做的都可以用原子的振动和摆动来解释。”
磁共振技术的另一个优点是它们可以测量原子之间的精确距离。因此,通过精心设计的实验,可以在实验室中验证AlphaFold的输出结果。在其他情况下,结果仍然存在不确定性。这是一个实验结构生物学家(如我的团队)和计算科学家之间的合作过程。诺贝尔奖的认可将进一步激发理解所有分子机器的追求,希望在药物、疫苗和人类健康方面改变游戏规则。
(全文结束)


