蛋白形态谜题:解锁下一个前沿领域The Proteoform Puzzle: Unlocking the Next Frontier

环球医讯 / 健康研究来源:www.news-medical.net美国 - 英文2025-07-16 02:45:27 - 阅读时长13分钟 - 6173字
本文采访了2025年拉尔夫·N·亚当斯生物分析化学奖得主Lloyd M. Smith教授,探讨了蛋白形态这一值得成为下一个“人类基因组计划”的研究领域,并阐述了其在心脏病和新冠等疾病中的重要性以及未来发展方向。
蛋白形态蛋白组学质谱技术疾病心脏病新冠人类蛋白形态项目数据分析人工智能纳米孔技术健康
蛋白形态谜题:解锁下一个前沿领域

您是什么时候开始对科学感兴趣的?又是如何走到今天的?

我成长于伯克利,从小就被科学包围——我的母亲是数学家,父亲是物理学家。由于父母都在学术界,我从小就浸润在科学环境中。然而,像许多孩子一样,我当时并没有对某个特定领域产生强烈兴趣。

直到大学时,我才逐渐被科学吸引。我发现最让我感兴趣的是那些与科学相关的课程。我一直欣赏科学基于证据的特性。在人文学科中,争论可能无休无止,但在科学中,往往有一个明确的答案——这种清晰性深深吸引了我。

选择专业时,我选择了生物化学。当时我觉得化学很有趣且令人投入,所以这是一个自然的选择。后来,出乎意料的是,我发现自己喜欢上了物理学,尽管最初因为这是父亲的领域而刻意回避。这导致了一个有趣的情况:我是一个喜欢物理学的生物化学专业学生。

与此同时,我已在化学系从事研究工作,因此形成了跨学科的基础。当我申请研究生院时,我选择了生物物理学来整合这些领域的知识。我加入了斯坦福大学的生物物理学项目,但最终还是在化学系工作。

博士后期间,我最初计划专注于细胞生物学,这是我之前接触过并感兴趣的一个领域。但计划发生了变化,我参与了一个自动DNA测序仪开发项目,结果发现这个项目非常有回报。它结合了我在本科阶段学习的合成化学,以及研究生阶段掌握的荧光、光学、激光和电子学技能。所有这些技能都发挥了关键作用,并促成了项目的成功。

这个项目最终为我打开了第一份学术职位的大门,但这条道路并不容易。我在求职市场上花了两年时间。第一年尤其艰难——无论是我还是招聘委员会都不太确定如何定义我的专长。我从事DNA相关工作,所以我以为自己是一名生物化学家。虽然生物化学系邀请我面试,但没有提供职位。

最终,有人开始建议我考虑分析化学,一个我从未认真思考过的领域。我唯一的相关经验是一门本科课程,但我对其印象并不深刻。然而,在求职过程中,分析化学界,尤其是威斯康星大学的团队,对我表现出了极大的开放和欢迎态度。他们看到我以强大的物理科学背景解决复杂的生物学问题,并欣赏这一视角。事实证明,这是一个极佳的匹配,我也因此成为了威斯康星大学的一名分析化学家。

蛋白组学和蛋白形态什么时候成为您职业生涯的一部分?

我大约花了10到15年的时间专注于DNA测序,这在当时是一个非常好的契合点。我的博士后工作已经让我在这个领域站稳了脚跟,因此获得资助相对顺利。这是一个引人入胜的研究领域,但随着时间推移——特别是在电泳框架下——我开始感到我已经探索了其中最有趣的部分。

我还注意到自己的心态发生了变化。当人们提出新想法时,我常常会想:“我已经考虑过这个——它不会奏效。”这种反应对我来说是一个警示信号。它表明我变得停滞不前,是时候尝试新事物了。

大约在那个时候,我对质谱技术产生了兴趣,特别是将其作为电泳在DNA测序中的潜在替代方案。用质谱取代电泳的想法令人兴奋,这一转变带来了全新的挑战和学习机会。虽然我们最终未能通过质谱技术解决DNA测序问题,但这个过程为我在该领域奠定了坚实的技术基础。

与我的DNA测序经历类似,我对在特定背景下使用质谱技术的热情最终也开始减退。但在完全退出之前,我意识到开发的许多技术可以应用于蛋白组学。这促使我们开始涉足蛋白组学领域,从MALDI转向电喷雾电离(ESI)。

这一转变特别令人兴奋,因为我们开发了一种电荷减少方法,使电喷雾电离光谱类似于MALDI生成的光谱——这是一个令人惊讶且引人入胜的结果。这一发现让我们更深入地进入了蛋白组学领域,并最终进入传统的“自下而上”方法和更广泛的领域。

从那时起,我一直在不断学习,深入研究蛋白组学和蛋白形态,并继续探索质谱技术如何揭示新的生物学见解。

蛋白组学有两种主要方法:自下而上和自上而下。您能否解释两者的区别,以及为什么在研究蛋白形态时自上而下的方法可能更有益?

自下而上的蛋白组学是标准方法——可能超过95%的领域都在使用这种方法。它是一种成熟且稳健的技术。

在自下而上的蛋白组学中,您将蛋白质或蛋白质混合物用酶消化成肽段,然后通过液相色谱和质谱分析和鉴定这些肽段。这种方法功能强大、广泛使用,允许研究人员识别和量化复杂混合物中的肽段。

然而,自下而上的蛋白组学无法提供蛋白形态层面的信息。蛋白形态指的是完整的蛋白质,包括任何修饰或变异,使其与其他形式的同一蛋白质区分开来。要获得这种级别的细节,您需要自上而下的蛋白组学。

自上而下的蛋白组学遵循相同的基本流程,但分析整个蛋白质而不将其分解为肽段。这种方法比处理肽段更具挑战性,但它提供的数据极具价值。

该领域仍有很大的发展空间,这使其成为一个令人兴奋的研究方向。更重要的是,我相信理解蛋白形态、确切知道您正在研究的分子是什么,对于真正理解生物系统至关重要。

您能否解释什么是蛋白形态家族及其生物学意义?

让我先解释一下蛋白形态家族概念的由来。我曾尝试通过测量完整质量而不将其分解为更小片段的方法来分析整个蛋白形态。

这种方法的优势在于其简单性和速度——您只需测量一个质量。当然,权衡之处在于您失去了关于这个质量具体代表什么的详细分子信息。我们仍在努力了解这种方法在哪种情况下最有效。

图片来源:Christoph Burgstedt/Shutterstock.com

我们的首次测试将这种方法应用于酵母蛋白质组。然而,当我们分析数据时,我们发现获得的可靠鉴定数量远低于预期。此时,实验室的Mike Shortreed提出了一个关键见解。他查看数据时注意到一些未鉴定的质量与已知蛋白形态之间的差异对应于已知的翻译后修饰(PTMs)。

如果我们有一个确认身份的蛋白形态,另一个分子的质量偏移(例如磷酸化的质量),我们可以合理推测第二个分子是同一蛋白质的修饰版本。我们开始称这些为实验-理论(ET)对——一个已知的蛋白形态与基于理论质量偏移预测的相关分子配对。

Mike进一步推动了这一想法。他意识到,即使我们没有蛋白形态的理论匹配,仍然可以通过观察已知PTM质量偏移来检测实验观察之间的关系。

这些被称为实验-实验(EE)对——仅通过观察到的质量差异连接的分子。利用Cytoscape(一种网络可视化工具),我们将这些关系组装成称为蛋白形态家族的集群。

这种方法显著扩展了我们能够连接和解释的蛋白形态数量。从概念上讲,我对此非常欣赏。它提供了一种更加以基因为中心的蛋白组学视角。传统上,我们认为每个基因制造一个蛋白质——但“蛋白质”的定义有点模糊。相反,我们可以认为每个基因产生一组蛋白形态——就像一组相关分子。正如一个家庭有父母、孩子和堂兄弟姐妹,一个基因通过可变剪接或翻译后修饰等方式产生各种形式的蛋白质。

这一框架有助于简化我们对生物复杂性的思考方式。我喜欢设想大约2万个蛋白形态家族——每个家族对应人类基因组中的一个基因。每个家族包含从该基因衍生的不同蛋白形态。

如果我们要真正理解生物系统,就需要测量这些家族及其成员如何响应不同条件、环境或扰动。

这些蛋白形态家族的一些成员对疾病有影响,包括心脏病和新冠。您能否分享一些蛋白形态如何涉及这些疾病的例子?

有几个例子浮现在脑海中。其中之一是在心脏生物学领域。我的同事Ying Ge也从事自上而下的蛋白组学研究,她研究了心肌肌钙蛋白——特别是肌钙蛋白A。她表明,与健康心脏相比,患病心脏中这些蛋白形态的磷酸化状态存在显著差异。

这只是冰山一角。在生物学乃至整个科学领域中,始终存在相关性与因果关系的问题。

一种框架是通过生物标志物的视角来看待这个问题。如果某种特定的磷酸化蛋白形态可以在血液中持续检测到,并可靠地指示心脏病的存在,那么它可以用作诊断标志物。然而,证明其临床效用需要时间和严格的验证。

另一种可能性是这些蛋白形态差异不仅仅是与疾病相关,而是致病因素。如果是这样,那么理解驱动这些变化的机制可能会为干预打开机会,甚至可能通过小分子治疗实现。

另一个引人注目的例子出现在新冠疫情大流行期间。在家工作期间,我开始探索新的研究方向,并发现新冠为蛋白形态相关性提供了引人注目的案例。有一种酶参与先天免疫反应,在抵抗病毒感染中发挥作用。人群中遗传变异导致这种酶的不同蛋白形态。

其中一种蛋白形态包含一个跨膜结构域,使其能够锚定在膜上并有效运作。另一种较短的蛋白形态缺乏这一结构域,无法正确定位。结果,仅表达截短形式的个体基本上缺乏这一免疫反应臂,可能导致新冠感染更严重的后果。

不同的科学界如何解读这一现象也很有趣。遗传学家可能只关注它是基因组中的变异,而不强调蛋白形态的意义。自下而上的蛋白组学研究人员可能将其描述为翻译后事件——也许是截短。在自上而下或以蛋白形态为中心的观点中,我们将其视为一种独特的蛋白形态,其功能性后果与其结构差异密切相关。

这些解释并不冲突——它们只是对同一生物学现象的不同视角,受各自学科视角的影响。

您参与了人类蛋白形态项目提案。您能告诉我更多关于这个项目的内容以及它的目标吗?

我深度参与了人类基因组计划,因为我博士后期间开发的仪器最终成为测序工作的关键工具。该项目支持了我的大量研究,我还在多个委员会中帮助监督其进展。即使在当时,这也感觉是一个组织良好的倡议——事后看来,其结构和执行显然非常有效。

该项目成功的主要原因之一是其建立在多个支柱之上,其中一个最重要的支柱是技术发展。当基因组项目开始时,早期的测序仪器相当基础。但随着资金增加和商业兴趣增长,我们看到了性能的重大飞跃。

国家人类基因组研究所(NHGRI)在此过程中发挥了核心作用,专门资助技术导向的项目,从而推动了测序技术的快速创新。

与此同时,还有一个强有力的执行支柱:实际进行基因组测序。这种方法之所以如此有效,是因为开发与实施之间的互动。新技术在真实的测序环境中接受了压力测试,大规模基因组测序的实际挑战推动了技术的进步。

这种模式——将技术创新与雄心勃勃的大规模执行相结合——正是我们希望带到人类蛋白形态项目中的。目标是围绕蛋白形态引发与基因组计划在DNA领域类似的兴奋和动力。我们希望看到政府机构和资助者以类似规模支持这一努力。

目前,质谱技术是蛋白形态分析的主要工具,持续渐进式的改进至关重要。然而,我们也需要鼓励更大胆的思维。

基因组世界的一个很好的例子是纳米孔测序。我记得曾参与过一些最早的纳米孔提案评审——当时它们看起来非常投机。大约二十年后,这一概念才成熟为如今强大且广泛应用的技术。但现在,纳米孔测序已经彻底改变了某些基因组分析的方式。

这就是我们需要的蛋白形态思维,为大胆、高风险的想法创造空间,这些想法可能需要时间,但最终可能会重塑该领域。如果我们投资于许多早期项目并接受并非所有项目都会成功的事实,我们就有可能发现改变游戏规则的工具和方法,重新定义我们研究蛋白组的方式。

您的实验室目前正在做哪些工作来促进这些新技术的发展?

我们目前改善蛋白形态分析的努力主要集中在数据分析方面。如果您考虑典型的工作流程,我们仍然牢牢处于质谱框架内。虽然我对纳米孔测序很感兴趣,但我觉得自己进入这个领域有点晚了——许多团队已经深入投资于这一领域。我尚未提出一种脱离质谱的新技术来进行蛋白形态水平分析。

因此,在质谱领域内,我倾向于将过程分为三个部分:在质谱仪之前、仪器本身以及之后。

在使用仪器之前,您需要样品制备和分离技术。在这方面肯定有改进的空间,但大多数进步往往是渐进的。至于仪器本身,这些机器极其复杂。像赛默飞世尔科技(Thermo Fisher)和布鲁克(Bruker)这样的公司拥有才华横溢的工程师团队,他们不断突破硬件能力的边界。

但在质谱仪之后呢?这才是事情变得真正有趣的地方。这些仪器产生的原始数据高度复杂,其中隐藏着大量有价值的信息。提取和解读这些信息是我们小组约三分之一到一半人员的重点。

尤其是在人工智能兴起的当下,这是一个特别激动人心的时刻。回想起来,人类基因组计划在很大程度上是由计算技术的进步推动的。在20世纪80年代,生物信息学还处于起步阶段,与今天相比有很大差距。我认为人工智能的崛起是一个类似的转折点。我们已经看到了它的潜力,但我相信我们才刚刚开始理解它可能带来的变革性影响。

人工智能有可能解锁全新的蛋白形态数据分析方式,这使得这一时刻对该领域如此充满希望。

您提到试图引起政府对资助的关注。私营部门在这个领域扮演什么角色?

私营部门对该领域表现出浓厚兴趣。公司已经正确地认识到,自下而上的蛋白组学已经代表了一个庞大且成熟的市场,他们正在积极寻找方法,要么接管要么用新技术颠覆这一领域。

许多这些努力显然受到DNA测序领域发生的事情的启发。早期,第一个人类基因组是使用基于电泳的方法测序的,但真正推动该领域发展的却是向下一代测序(NGS)的过渡。这一飞跃涉及将基于阵列的平台与基于荧光的测序相结合的创新——数百万个测序反应同时在一个芯片上进行,高分辨率成像捕捉结果。

因此,现在人们自然会问:我们能否为蛋白质做类似的事情?这并不是一个遥不可及的想法,几组团队正在朝着这个目标努力。Ed Marcotte是我看到探索这一领域的第一批研究人员之一,尽管在他之前可能还有其他人。从那以后,许多公司带着类似的概念进入该领域——尝试将基于阵列的高通量策略应用于蛋白组学。

然而,对我的挑战在于,这些技术——至少在其当前形式下——无法捕获蛋白形态。它们通常专注于检测肽段或蛋白质的存在,而不是完整分子复杂性,包括翻译后修饰和序列变异。对于我们这些专注于理解蛋白形态层面的人来说,这是一个关键的差距。

您认为未来十年蛋白形态会是什么样子?

质谱技术仍有很大的发展空间。在自上而下的蛋白组学方面,我相信在未来十年内,我们有可能将其能力提高十倍。

许多渐进式改进——比如更好的分离技术——可以帮助我们朝这个方向前进。在短期内,我预计质谱技术仍将是蛋白形态研究的主要工具。

话虽如此,我不认为质谱是最终解决方案。它让我想起了基于电泳的测序——在它的时代可靠且高效,但最终被更新、更具扩展性的技术所取代。我特别关注纳米孔技术。我不确定它们是否能够捕获所有的翻译后修饰——种类繁多且多样——但我确实认为基于纳米孔的方法将在蛋白质分析中产生重大影响。

我经常思考人类基因组计划是如何展开的。第一个完整基因组序列为我们提供了基础参考,随后该领域开始转变——从发现模式转向评分模式。重点转移到更快、更高效地识别和量化我们已经知道存在的内容。

我认为蛋白形态研究将遵循类似的路径。质谱技术通过持续创新和支持,可以提供基础的蛋白形态图谱。一旦完成,其他技术——如纳米孔或基于阵列的系统——可以介入,使蛋白形态分析更具扩展性和可访问性。

现在的关键是为未来的工具奠定基础。

您的未来有何打算?

有几个领域我现在非常感兴趣。首先,我对蛋白形态领域非常感兴趣——我想继续在这个领域推动前进。其次,我正在研究我们在阿尔茨海默病中发现的脱氢氨基酸。我想跟进这项研究。

第三,我对表观转录组学越来越感兴趣。我认为我们为蛋白形态开发的许多工具——我们的软件、分离技术和质谱方法——也可以应用于RNA。这是一个重要且尚未充分探索的领域,有许多未知数。


(全文结束)

大健康
大健康