分子——这些看不见的建筑师,构成了从细胞DNA到遥远星系行星的一切,编织着现实的织物,却始终小到无法被肉眼捕捉。但得益于加州大学圣地亚哥分校计算、信息与数据科学学院下属圣地亚哥超级计算机中心(SDSC)支持的蛋白质数据库(PDB),我们现在能"看见"这些隐藏的奇迹,使科学家得以"放大"分子机制,描绘其形状并破译其秘密。研究人员不再局限于孤立研究单一分子,而是能够比较多种分子、测试细微变化、预测行为并为新药物、疾病理解、更有效疫苗及健康食品设计更优分子。每一次新发现都提醒我们:宇宙最伟大的杰作不仅环绕四周,更存在于我们体内。
全球首个生物数据库的诞生
1971年,一群富有远见的结构生物学家创立了PDB,其宗旨在于将全球日益增长的分子结构集合公开化与标准化,将孤立发现转化为生命分子架构的共享协作全球图书馆。这一革命性理念使PDB成为生物学史上首个开放获取的数字档案库。数据库最初仅收录7个分子,记录其生物名称、功能及来源生物体(如人类、动物、有机体、细菌和病毒)。半个世纪后,该档案库现已容纳超24万个实验测定的三维生物分子结构,且每年持续扩充。数据由全球研究实验室提交,经全球蛋白质数据库(wwPDB)这一国际合作伙伴精心整理分发。如今,wwPDB的美国数据中心由结构生物信息学研究协作组织(RCSB)运营,自1999年与SDSC合作以来,该信息库已向全球科学家、研究人员和学生开放。
看不见,却铭记于心
分子存在于人类视觉阈值之下,甚至常逃过先进显微镜的捕捉。RCSB PDB主任斯蒂芬·K·伯利博士解释了科学家如何绘制并呈现PDB中存储的3D模型:"目前确定蛋白质结构的方法包括X射线晶体学、核磁共振波谱学和3D电子显微镜。在每种方法中,科学家都将大量实验数据与相关科学信息结合,创建PDB中最终的原子结构模型。"他指出,PDB结构为现代分子建模奠定了基础,如今该领域利用超级计算机和量子力学实时预测生物分子的运动与反应。研究人员和学生使用虚拟现实等复杂可视化工具研究PDB及其他相关结构。PDB存储的海量3D结构数据推动了蛋白质架构理解的重大进展,最终促成近期人工智能驱动的蛋白质结构预测突破。
为何分子是万物基石
为何3D分子成像如此重要?"蛋白质等生物分子的3D形状极为关键,因其决定分子功能、与其他分子的相互作用及生物学角色,"RCSB PDB/SDSC科学软件开发员兼数据架构师亚娜·罗斯表示,"理解其3D结构使我们能解释其工作机制、设计有效药物并工程化新材料。"当从原子和分子尺度放大观察时可见:
- 所有材料——固体、液体、气体——均由不同排列与运动的分子(或离子)组成
- 宏观特性(熔点、硬度、颜色、溶解度)源于分子级结构与键合
- 在生命系统中,几乎所有物质都是分子:蛋白质、脂质、核酸、糖类等
- 复杂系统(细胞、组织、材料)源于分子相互作用、组装与动态
超级计算机与分子建模:SDSC的角色
现实中,我们无法直接"看见"每个分子或在实验室观察原子在微秒级时间尺度的位移,需要计算模型填补空白——模拟、对接研究、分子动力学等。SDSC提供高性能计算与数据基础设施,支持进行分子建模和结构生物学的研究人员。换言之,SDSC是RCSB PDB的性能站点——协助托管、分析和分发这些结构数据。3D建模使无形之物具象化,曾不可见之物变得可见。这如何助力无数分子研究实例?
- 研究人员可从RCSB PDB获取数千种不同蛋白质、核酸及其复合物的结构——部分归功于SDSC的基础设施
- 借助超级计算机,可模拟分子运动(分子动力学)、药物或配体结合(对接),或突变如何改变结构与行为——全部达到原子分辨率
- 实例:科学家利用在SDSC运行或与其连接的软件,在分子层面模拟真菌酶降解塑料的过程,精确观察化学键如何被识别与切断
- 简言之:3D模型使化学与生物学变得直观。学生和科学家可在虚拟现实中探索分子,在模拟中旋转它们,观察教科书仅能描述的动态过程。这些模型助力全球研究人员验证假设、设计疗法并可视化生命分子机器的真实运作——原子级运作
分子聚焦专栏
2000年SDSC与RCSB PDB使PDB资源更易获取后不久,RCSB PDB推出了"分子月度"(Molecule of the Month)月度专栏。该专栏旨在使复杂分子科学对广大受众——从学生教师到研究人员乃至普通公众——变得可及、引人入胜且具视觉意义。若将此视为分子世界的人性化呈现,专栏阐明了不可见分子实为生命戏剧的真正主角——支撑人类在医学、营养、环境和技术领域的进步。"分子月度"由犹他大学生物化学系助理教授珍妮特·伊瓦萨创建。"我们许多文章聚焦时事,但采用分子视角,"伊瓦萨表示,"例如,最新文章探讨了奥利司他和 Wegovy 等减重药物背后的生物学原理。"
百万模型持续增长
PDB档案库包含近24万个实验测定的蛋白质、核酸及其复合物的3D结构。"PDB档案库代表着极其宝贵知识的累积,"RCSB PDB/SDSC科学软件主管兼加州大学圣地亚哥分校经理何塞·杜阿尔特表示,"在许多情况下,单个结构可能代表跨学科科学家团队数年的研究。"PDB使我们得以在原子层面知晓血红蛋白、DNA聚合酶、胰岛素甚至新冠病毒刺突蛋白的形态——这也是现代医学、生物工程和分子研究能够精准运作的原因。此外,RCSB PDB现已将人工智能预测的计算结构模型(CSMs)与实验推导模型整合。因此,包括真实与预测模型在内,RCSB PDB在RCSB.org提供超百万个3D分子结构的访问权限,以及专用可视化与分析工具。蛋白质数据库是科学与医学研究无可比拟的资源。作为PDB的全球托管方之一,SDSC确保这一无与伦比的人类知识库向所有人开放。
十大分子精选!
1. DNA——生命的蓝图
携带所有生物遗传指令的优雅螺旋梯形分子。
2. 血红蛋白——氧气运输者
存在于红细胞中的蛋白质,如同微型氧气运输车,随后将二氧化碳带回以供呼出。
3. 肌红蛋白——肌肉氧气储备库
若血红蛋白是运输车,肌红蛋白则是储罐。存在于肌肉中,为身体活动时提供应急氧气。
4. 胰岛素——糖分调节器
维持血糖稳定的微型激素,帮助身体利用或储存食物中的葡萄糖。在科学家理解其结构前,胰岛素需从动物提取——3D建模为合成人类胰岛素铺平道路。
5. 抗体——人体守卫
Y形蛋白质在血液中巡逻,识别并标记病毒细菌等入侵者以供摧毁。
6. 新冠病毒刺突蛋白——病毒钥匙
新冠病毒附着人类细胞的部分——解锁感染的钥匙。理解其3D结构助力科学家设计阻断该钥匙孔的疫苗。建模后,刺突蛋白成为现代史上最被深入研究的分子之一。
7. 光系统II——自然的太阳能板
植物利用此巨型分子复合物在光合作用中分解水并产生氧气——将阳光转化为化学能。
8. 胶原蛋白——人体支架
人体最丰富的蛋白质,形成皮肤、骨骼、肌腱和软骨的坚固框架。如同混凝土中的钢筋——没有它,我们将形如果冻。
9. DNA聚合酶——生命复印机
细胞分裂时,DNA聚合酶逐字复制整个基因组——其精确度高达约十亿个遗传密码仅出错一次。
10. 淀粉样蛋白——错误折叠的蛋白质
在阿尔茨海默病等疾病中聚集的错误折叠蛋白质。原本有益的分子缠结并堵塞大脑电路。然而部分淀粉样蛋白有益——某些细菌用其构建保护涂层。
所有这些分子故事及数百个案例均收录于RCSB PDB的"分子月度"专栏(pdb101.rcsb.org)。每篇文章包含彩色3D可视化、简明解释甚至课堂材料——架起基础科学研究与公众理解的真正桥梁。
【全文结束】


