重访重大挑战:计算机辅助药物设计前沿的已行之路与未来方向Frontiers | Revisiting the grand challenges: the road travelled and ahead at the frontiers of computer-aided drug design

环球医讯 / 创新药物来源:www.frontiersin.org墨西哥 - 英语2026-03-05 22:34:35 - 阅读时长11分钟 - 5271字
本文系统回顾了计算机辅助药物设计(CADD)领域过去五年的发展历程,重新审视了化学与生物空间扩展、方法学创新、科学数据共享及教育培训等核心挑战。作者指出,尽管人工智能推动了超大规模化学库构建和深度对接等技术突破,但合成可行性、数据质量、可重复性及术语滥用等问题仍是关键瓶颈。文章强调需平衡传统方法与新兴技术,加强跨学科协作,并通过严谨教育培养批判性思维,以应对超越传统"类药五规则"的新型药物开发需求,最终推动计算工具在药物研发全流程中发挥更可靠的作用。
药物发现药物研发计算机辅助药物设计靶点识别精准医学罕见病药物毒性建模可开发性网络药理学PROTACs类药空间化学空间生物空间
重访重大挑战:计算机辅助药物设计前沿的已行之路与未来方向

背景

自20世纪60年代人工智能(AI)早期应用以来(Gasteiger, 2020),计算机模拟方法已取得显著进展,塑造了当今公认的现代计算机辅助药物发现(CADD)时代——或如Gisbert Schneider博士所精确定义的,计算机辅助生物活性化合物发现时代。如今,计算工具正被密集应用于药物研发流程的几乎所有阶段,其应用范围从基础研究中科学文献的快速筛选与分析,延伸至后续所有环节,包括监管审批及上市后跟踪。

自《药物发现今日》杂志"计算机模拟方法与人工智能在药物发现中的应用"专栏发表《计算机辅助药物设计的重大挑战:未来之路》一文已过去五年(Medina-Franco, 2021)。本文旨在结合该领域近年来的快速变革性进展,重新审视并更新这些重大挑战。在此过程中,我们将评述最新进展,强调持续存在与新兴的障碍,并识别由此加速进步催生的新机遇。

本文分为四个主要部分:首先探讨1.化学与生物空间,随后分析2.方法学与技术,以及3.教育与人为因素——这些因素在药物研发中同样发挥关键作用。最后部分呈现4.总结性结论。与先前观点文章类似(Medina-Franco, 2021),本文讨论的挑战及对未来CADD发展方向的观点,均基于作者对科学文献的理解及自身经验。本文核心目标是激发学术界讨论,同时承认这些观点将持续接受修订与未来更新。值得注意的是,本文讨论刻意避开AI本身——过去五年间已有大量文献详述AI在药物发现中的前景与局限,诸多案例(远非穷尽)已在其他研究中报道(Jiménez-Luna et al., 2021; Jacobson, 2025; Zhang et al., 2025)。事实上,近年来已涌现多本专门致力于记录与批判性评估AI驱动药物发现进展的科学期刊。

化学与生物空间

化学空间(Reymond, 2025)及其通过多样化描述符集的多重表征,构成现代药物发现的核心支柱,其影响力正日益超越传统生物活性小分子范畴。在苗头化合物识别、分子设计及苗头化合物优化过程中,生物相关化学空间(Medina-Franco et al., 2025)的概念持续拓展,涵盖传统有机小分子未覆盖的区域。这些区域包括但不限于含金属化合物、多肽、大环化合物、靶向蛋白质-蛋白质相互作用的分子,以及蛋白降解靶向嵌合体(PROTACs)等代表性示例,均位于常规"类药"空间之外。更广泛而言,探索与填充符合"超越类药五规则"范式的化学子空间正日益受到重视(Doak et al., 2016)。与此同时,传统小分子有机物与多肽、天然产物交叉领域的药物研发势头持续增强,而计算方法的应用进一步加速了这一趋势(Saldívar-González et al., 2022; López-López et al., 2026)。

近年来化学研究的重大进展之一,是通过多种计算方法枚举大型乃至超大型化学库(Warr et al., 2022; Korn et al., 2023; Corrêa Veríssimo et al., 2025; Neumann and Klein, 2025)。该领域的持续挑战在于设计与枚举具备合成可行性且实验可操作的化学库(Korn et al., 2023)。然而同等重要的是,需聚焦库的"质量"而不仅是规模,确保其包含有意义的结构与理化多样性——尤其当目标是探索新型或未充分开发的生物相关空间区域时。

治疗相关分子靶点的识别仍是活跃研究领域。关于分子靶点建模,弥合计算生成的靶点模型与其在生物大分子内在生物复杂性中行为之间的差距(如结合位点可塑性、别构效应、诱导契合、膜环境、内在无序区域及细胞环境影响)仍具难度但至关重要。与此同时,网络药理学(旨在验证靶点组合、优化多结构-活性关系或结构-性质关联,同时保持类药特性)(Hopkins, 2008; Zhang et al., 2023),以及多靶点药物设计、针对被忽视疾病与罕见病的药物研发,仍是重要研究课题。此外,精准医学作为当代药物发现的指导范式正日益凸显其相关性(Dugger et al., 2018)。药物候选物的毒性建模、代谢处理、真实生物条件下的稳定性及整体可开发性,仍是重大挑战——这对超出传统"类药五规则"的候选物尤为突出。

方法学与技术

过去五年间,数据驱动方法在药物发现中日益重要,尤其是与AI相关的技术。然而如背景部分所述,AI方法论不在本文讨论范围内,因其已在其他研究中得到广泛持续评述(Jiménez-Luna et al., 2021; Jacobson, 2025; Zhang et al., 2025)。经典方法(包括化学信息学、分子动力学及CADD涵盖的各类计算机模拟策略)仍居核心地位。受益于高价值公共数据集的日益丰富与机器学习进步,许多经典技术正显著增强。典型例证包括通过所谓"深度对接"对海量化学库进行对接(Gentile et al., 2020),以及由深度学习增强的虚拟筛选工作流(Zhang et al., 2024)。同时,旨在快速生成化学物质的新方法(如DNA编码库及相关技术)已在近期文献中开发并评述(Korn et al., 2023; Hönig et al., 2024)。下文将进一步探讨,核心挑战不仅在于增加数据的数量与可及性,更在于确保其可靠性与整体质量。

探索化学结构与其响应关系的新范式——即结构-性质关联(SPAs)(López-López et al., 2026)——近期被提出。预计这些方法将在未来几年显著影响新型分析框架与预测方法学的发展。

在与教育的接口方面(下节讨论),关键挑战在于识别药物研发项目中方法的有效组合,而非追求单一"最佳"方案。如近期讨论所示,整合多种方法(在特定情境下常称为共识法或数据融合法)可产生更稳健可靠的结果(Medina-Franco et al., 2024)。因此,建议识别能平衡传统方法与新兴方法学发展的适当方法组合。

除AI相关技术外,量子计算在推进药物发现方面持续展现潜力。如近期综述所述(Blunt et al., 2022; Santagati et al., 2024; Sood and Pooja, 2024),量子计算在制药业实际应用中仍处早期阶段,但正被积极开发(Santagati et al., 2024)。普遍预期未来几年内,量子计算将在药物研发中获得日益实际的应用价值。

科学交流、数据与代码共享

毫无疑问,科学进步仍由有效科学交流驱动,涵盖同行评审期刊的传统出版、会议、研讨会及在线网络研讨会。在线网络研讨会(许多在新冠疫情后仍保持免费开放以支持科学民主化)在疫情期间广泛普及,现已成为知识交流的标准模式。同时,预印本的传播显著增加(Coudert, 2020),为数据、信息及最终知识的共享提供了更快捷的初步途径。

与同行评审科学出版物密切相关的是,计算研究 increasingly 伴随原始数据及生成计算结果、实施分析方法的代码共享。这些实践旨在促进可重复性或复现性——这仍是科学研究的基石(Calnan et al., 2024; Udesky, 2025)。因此,科学期刊(特别是开放获取模式运营的期刊)持续调整政策以符合FAIR数据原则(Wilkinson et al., 2016),即研究产出应具备可发现性(Findable)、可访问性(Accessible)、互操作性(Interoperable)和可重用性(Reusable)。

在推广与维持FAIR原则过程中,主要挑战包括确保或密切监测共享研究对象的质量。另一重大挑战涉及长期维护免费开放存储库的能力,以存储和保存分子动力学模拟等产生的海量原始数据(包括多重副本)。进一步挑战在于持续推广负面结果的传播——这最终可丰富并强化预测模型。如其他研究所述,报告负面数据并非传播因设计不当分析导致的不可靠结果,而是指通过稳健的实验或计算(湿/干实验室)研究生成的数据,这些研究基于精心构建的假设,但最终被证明不成立或呈现"负面"结果(López-López et al., 2022)。此外,该领域持续存在的挑战是促进协作创新与高效团队合作(Steinbeck, 2025)。在FAIR数据核心,公开预测的可靠性仍具挑战性。科学出版物必须解决估计的不确定性,包含前瞻性验证,并尽可能开展社区辅助基准测试(最好有实验验证支持)。

其他持续挑战涉及开放科学与开放获取时代科学出版的整体框架(Arita et al., 2024)。这包括科学传播成本——此处指开展研究本身所需投资(如科学家、学生及技术人员经费),以及出版商为管理同行评审(主要由学术界支持)和维护研究产出可访问性所承担的成本(及利润)。这些挑战因AI在科学出版中日益重要的角色而进一步复杂化,包括其负责任使用与潜在滥用(Salvagno et al., 2023)。

培训与教育

教育及新入行者的适当培训,仍是药物发现的核心支柱(Varnek et al., 2025)。鉴于AI在科学及其他社会领域的日益普遍——有时甚至被滥用,迫切需要教育当前及未来从业者以伦理且负责任的方式应用AI。

受当前"AI热潮"驱动,术语本身也出现广泛误用。如今,药物发现中的AI常被错误地用作CADD、计算化学或分子建模的同义词。尽管这些领域密切相关,但并非可互换。毫无疑问,过度强调"潮流"而非概念严谨性会对科学术语的精确使用产生负面影响。这是教育中的重大挑战,必须从培训早期阶段着手解决(Medina-Franco et al., 2021)。

密切相关的挑战在于向学生传授经典与当代方法的广泛谱系,同时培养批判性思维及基于方法基本原理与假设(而非其流行度或感知潮流性)的理性方法选择能力。在此背景下,尤其应鼓励学生(尤其是早期培训者)避免试图用单一方法解决所有问题,而是根据最合适分析或计算方法调整问题表述。

另一重大挑战涉及培训学生和早期职业研究人员清晰表达观点并严谨报告科学结果的能力。对大型语言模型的日益依赖可能削弱原创性及清晰表达新想法的能力发展。因此,教育应强调培养独立思考、概念清晰及科学写作技能——AI工具应作为辅助助手而非批判性思维或创造性思考的替代品。

结论

自2021年《计算机辅助药物设计重大挑战》发表五年后,该领域在方法学发展、数据可及性与计算规模方面已取得显著进展。然而,当时识别的许多核心挑战仍未解决,同时新挑战不断涌现。化学与生物空间的扩展(尤其是超越传统小分子范畴)凸显:规模本身无法保证相关性;确保合成可行性、数据质量与生物重要性仍是核心瓶颈。方法学发展强化了结合互补方法(而非追求单一"最佳"方法)的相关性,但可重复性、数据质量及过度解读问题依然存在。同样重要的是算法之外的挑战:维持FAIR高质量数据与代码共享、计算预测的前瞻性与实验验证、开放科学时代科学交流的重新思考,以及加强教育以应对术语滥用与盲目采用潮流方法。展望未来,解决这些相互关联的挑战不仅需要技术创新,还需持续的文化与教育转变,强调批判性思维、负责任的工具使用及整个CADD社区的科学严谨性。尽管计算工具在药物研发多环节持续发挥重要作用,但如近期讨论所述,计算机模拟方法在未来几年内不太可能承担药物设计的全部责任(Medina-Franco and López-López, 2024)。

声明

作者贡献

JM-F:经费获取、项目管理、初稿撰写、审阅与编辑。

经费支持

作者声明本工作及/或其出版获得资金支持。JM-F的研究目前部分由Miztly项目LANCAD-UNAM-DGTIC-335资助。

致谢

衷心感谢DIFACQUIM研究组现任及前任成员的宝贵讨论。同时感谢同行评审过程中收到的建设性意见,这些意见有助于改进稿件。

利益冲突

作者声明本工作在不存在任何可能被视为潜在利益冲突的商业或财务关系情况下完成。

作者JM-F声明其在提交时担任Frontiers编辑委员会成员。这未影响同行评审过程及最终决定。

生成式AI声明

作者声明本稿件创作中使用了生成式AI。AI仅用于检查语法和风格。稿件全部内容均为原创。

本文随图提供的所有替代文本(alt text)均由Frontiers在人工智能支持下生成,并已尽合理努力确保准确性(包括尽可能由作者审核)。如发现问题,请联系我们。

出版商声明

本文所有主张仅代表作者观点,不一定代表其所属组织、出版商、编辑或评审的观点。本文可能评估的任何产品或制造商提出的任何主张,均不视为出版商的保证或认可。

【全文结束】