超越偶然性:理性设计与AI扩展"不可成药"靶点版图Rational design and AI's expansion of the undruggable target landscape

环球医讯 / AI与医疗健康来源:www.drugtargetreview.com英国 - 英语2026-02-07 11:21:40 - 阅读时长9分钟 - 4377字
本文深入剖析人工智能如何突破传统药物研发中"不可成药"靶点的历史局限,阐述AI通过高质量数据集、计算理性及涌现特性将偶然性转化为战略的过程。文章详细解释几何深度学习揭示隐蔽结合位点、靶向蛋白质降解剂等创新疗法的工作原理,同时警示过度依赖现有数据可能导致创新局限,强调未来药物研发需平衡AI计算效率与人类直觉,构建人机协同模式以攻克癌症、神经系统疾病等曾被视为无法治疗的疾病,为生命科学领域带来革命性变革。
健康AI不可成药靶点药物研发理性设计蛋白质结构高质量数据集靶向蛋白质降解剂分子胶几何深度学习生成化学
超越偶然性:理性设计与AI扩展"不可成药"靶点版图

数十年来,让"不可成药"靶点变得可成药被认为需要运气而非逻辑。如今,人工智能(AI)正将偶然性转变为策略,使研究人员能够采用理性、数据驱动的方法来攻克以往无法触及的靶点。许多靶点传统上被认为不可成药。直到最近,人们通常对这些靶点持谨慎乐观态度,认为使其可成药需要机缘巧合,而非理性设计。主流观点认为这些靶点不可能具有选择性。然而,通过结合人工智能(AI)算法、多样化分子库以及"解读"这些分子库的能力,再加上组学技术,现在靶点空间已经能够突破这些历史局限。

偶然性:从意外到突破

药物研发长期以来与偶然性密不可分,即从意外事件开始的科学发现。经典例子包括青霉素和顺铂,它们分别由亚历山大·弗莱明和巴内特·罗森伯格意外发现。偶然性以不同方式发生,因为意外事件对科学研究的影响各不相同。然而,即使是"非靶向研究",偶然性也不仅仅是纯粹的运气,而且没有任何科学发现是纯粹靠运气实现的。事实上,凭借知识储备、经验、好奇心、洞察力和想象力,科学家能够从偶然事件中获益,常常利用意外结果为突破铺平道路。如今,AI有能力通过用先进的计算模型取代大部分偶然元素和人类智力投入,从根本上革新这一过程。

计算理性与引导式创新的风险

计算理性描述了一种利用数学和算法模型做出最优决策的方法,同时考虑数据和计算中的现实约束。在药物研发中,这种方法使AI算法能够利用现有药理学数据优化决策,显著提高效率和速度。此外,AI促进了高度个性化疗法的开发:对基因组和临床数据的高级分析使药物能够针对特定基因亚群定制,提高治疗效果并减少副作用。

然而,这些优势伴随着权衡。过度依赖现有数据可能会限制对新型和不可预测化合物的探索,而这些化合物历史上推动了医学突破。AI系统可能忽视非传统分子或具有非典型作用机制的药物,可能导致制药行业趋向于相似的、可预测的解决方案,从而减少治疗多样性。

此外,算法决策的可预测性可能会抑制偶然性的作用——这一元素常常催化革命性发现。随机性在药物研发中的影响绝非微不足道;许多广泛使用的药物都是意外发现和幸运事故的结果。

高质量数据集

AI模型的有效性直接取决于稳健、高质量数据的可用性。尽管AI在设计有效靶向特定蛋白质的小分子方面取得了重大进展,但这一成功很大程度上归功于一个精心策划的数据集:蛋白质数据库(Protein Data Bank, PDB)的存在。数十年来,从1950年代至今,跨越几代科学家,PDB一直作为蛋白质结构的中央档案库。这种对准确性和完整性的专注产生了一个深度和实用性极佳的数据库。

PDB的价值不仅在于其庞大的数据量,还在于其严格的策划。每个条目都经过仔细验证,确保其所包含信息的可靠性。这种高质量标准对于训练AI模型至关重要,因为它最大限度地减少了可能损害预测准确性的错误和偏差的引入。因此,利用PDB的AI驱动药物研发工作取得了显著突破,特别是在识别与特定蛋白质靶点相互作用的潜在候选药物方面。这一成功故事强调了一个基本原则:AI在问责性、表格和语义可解释性、可靠性、稳健性、泛化性和准确性方面的表现,直接取决于其训练数据的质量和数量。

"可成药"与"不可成药"靶点

相当一部分与疾病相关的蛋白质仍被传统治疗方法视为"不可成药",这给药物研发带来了重大挑战。AI承诺的不仅仅是优化已知的化学和生物空间;它的目标是积极地探索未知领域。AI算法的最新进展,如AlphaFold2和RoseTTAFold,有望通过克服药物设计中长期存在的障碍,将几个先前不可成药的靶点转变为可成药靶点。由Isomorphic Labs和Google DeepMind共同开发的AlphaFold 3代表了蛋白质结构预测方面的最新重大进展。这个新时代模糊了可成药和不可成药靶点之间的界限,有效地扩展了可成药蛋白质组,并为曾经被认为无法治疗的疾病(包括癌症、神经系统疾病和代谢疾病)开辟了新的治疗可能性。

超越结合位点

让不可成药靶点变得可成药的关键在于AI创造全新策略的能力,这些策略超越了传统的基于占据的抑制。几十年来,大约85%的致病蛋白质被认为不可成药,因为它们缺乏小分子药物所需的明确定义的结合口袋。AI承诺的一个关键部分是其发现隐蔽口袋的能力——这些结合位点在蛋白质的自然状态下不存在,但会暂时出现或在配体结合时出现。通过揭示这些先前"不可见"的位点,AI正在为曾经被认为完全无法攻克的靶点创造新的药物设计切入点。除了发现新位点外,AI还通过促进新型治疗方式的理性设计来打破这一障碍,这些治疗方式通过不同的机制发挥作用。

这些新治疗方式的两个突出例子是靶向蛋白质降解剂和分子胶。通过超越直接的酶抑制,并利用AI理性设计劫持细胞机制的分子,研究人员正在系统地扩展可成药蛋白质组。然而,尽管前景广阔,AI在让不可成药靶点变得可成药方面的未来成功取决于克服关键挑战。主要障碍是缺乏训练和验证这些复杂模型所需的高质量、大规模数据——尽管某些治疗方式已取得进展。前进的道路需要协调努力来构建专业数据库,并且至关重要的是,建立一个反馈循环,其中AI的预测通过实验持续测试,结果用于改进下一代AI模型。这种对系统性协调努力的需求也在Cancer Moonshot研讨会的综合见解中得到强调,该研讨会特别呼吁建立一个针对不可成药靶点的联邦数据库和持续的协调投资。尖端计算工具与实验验证的结合,最终有望扩展可成药宇宙。

理解蛋白质结构和表面的一种新方法涉及几何深度学习。这种方法超越了传统的2D图像分析,实现了能够捕获蛋白质的曲率、形状、极性和疏水性的3D框架。这种多维模型能够更准确地表示和预测小分子将如何与靶点相互作用。

AI在计算药物研发中的应用

AI还支持针对先前不可成药口袋的小分子抑制剂的发现和优化。目前由AI增强的计算方法包括分子对接、虚拟筛选和模拟分子动力学。这些方法在虚拟环境中评估分子结合可能性,并在计算机上模拟分子的复杂动态行为。使用AI的生成化学方法可以提出人类化学家可能不会立即察觉的新化合物,尽管这些方法仍需要实验验证。例如,多模态转换器模型可以使用来自光谱数据(如红外或核磁共振光谱)的输入来预测分子结构。此外,条件变分自编码器(CVAE)生成模型用于生成新分子。这些由AI驱动的计算进展共同正在迅速改变药物研发的格局,揭示了有效靶向曾经被认为无法触及的蛋白质的新机会。

来自复杂模型的意外见解:涌现特性

有时,生成式AI模型似乎学到了比它们被教导的更多的东西,因为它们表现出行为、执行任务、得出结论和做出出人意料的预测。特别是,大型语言模型(LLMs),以其复杂和多层次的架构为特征,被公认为会展示涌现能力,类似于自然复杂系统,其涌现的、独特的特性既不能归结为,也不能从系统组件的特性中预测。LLM的几种能力已被证明在参数数量和训练数据集大小超过某些阈值时突然且不可预测地出现。这与涌现发生的观点一致,即当系统中的定量变化导致行为中的定性变化时,涌现就会发生。

类似于在自然系统中发生的情况,固有的复杂性阻碍了传统的机械论解释以及对未来可能出现的进一步能力或行为的具体预测,因此也使得难以预测模型开发和部署的后果。然而,许多被认定为涌现的能力并不会在通用测试中自发显示;相反,当模型参与特定操作环境时,它们会被触发。尽管不是有意构建的,涌现能力可以有意诱导,例如通过后训练技术,如提示和微调策略,并在更广泛的框架中在一定程度上被引导,以成本有效地提高模型性能,而无需进一步扩大规模或重新训练。因此,出人意料的意外结果可能源于所采用的方法,这些方法旨在解锁模型的潜在但可触发的能力,以最大化其潜力。

泛化、涌现与未来管道

结构预测是一个强有力的例子,说明一个全面、精心策划的数据库如何加速科学进步,释放AI在药物研发等关键领域的潜力。为了在不同科学学科中充分实现这种变革性潜力,必须优先开发和维护类似的高质量数据集。需要考虑的方面:

  • 业界能否以可泛化的方式做到这一点?换句话说,无论靶点或治疗方式类型如何,都能实现吗?
  • 药物的高效设计是否会促进下游基于多模态分析的系统,这些系统正被用于识别生物标志物和相关患者群体?
  • 可成药空间的扩展将是由生成式AI将现有数据重组为原始组件决定,还是由生成式AI发挥涌现能力决定,其中模型实际上从未见过这些数据?

根据最近的报告,制药公司正在投资于互联、数字化和可持续的实验室,旨在加速上市时间、优化成本并提高成功率。AI在自动化复杂流程和减少实验错误方面发挥着关键作用。然而,数据管理、流程日益复杂以及难以找到具有跨职能技能的专业人员是需要克服的重大障碍。方向很明确:未来的实验室将是高度技术化的环境,AI和人类干预将协同合作,彻底改变新靶点的发现。

结语:平衡效率与创造力

AI正在使药物研发过程更快、更高效。然而,为了促进真正的创新,这些优势应该与探索未知领域、采用非常规方法甚至保持一定程度的不可预测性相平衡(图1)。

图1:理性设计与AI扩展不可成药靶点版图的示意图

未来面临的挑战将是将AI整合到研究过程中,以实现计算效率与人类直觉之间的有益互动。这可以通过更新人机交互策略来实现,其中基于相关性的AI模型的独特能力与人类由意图驱动的创造力和推断因果关系的能力相结合。此外,尽管AI倾向于减少自然偶然事件的发生,但人类经常遇到AI模型本身展示的令人惊讶和不可预测的特征,这仍然挑战着他们找到利用意外的方法。

作者简介

雷姆科·扬·盖克斯·福彭博士是AI和生命科学专家,专注于制药行业,也是Explainambiguity的创始人。他具有全球视野,整合并实施影响商业决策的AI驱动策略;始终考虑人类因素。他的领导力在图像分析、数据管理、生物信息学、利用机器学习和联邦学习进行高级临床试验数据分析等领域推动了国际商业成功。雷姆科·扬·盖克斯·福彭的学术背景包括阿姆斯特丹大学的生物学博士学位和化学硕士学位。

保罗·达安布罗西奥博士是一位独立研究员,学术背景是认识论和进化论。他参与了专注于分子生物学、空间生物学和认知神经科学的科学研究项目。保罗目前的研究旨在评估最新一代数字技术对生物文化进化的影响,并探索AI在生命科学中的潜力。

文琴佐·乔亚是AI创新战略家,Explainambiguity的创始人。他是一位商业和技术高管,20年来专注于创新工具商业化的质量和精确性。文琴佐专长于应用于图像分析、商业智能和卓越性的人工智能。他对技术应用中人类因素的关注导致了高比例的解决方案实施。他拥有萨勒诺大学政治学和市场营销硕士学位。

【全文结束】