ETH苏黎世科学家如何利用AI加速药物发现 - AI与医疗健康

人工智能正被整合到药物发现的各个阶段。

（图：demaerre/iStock）

药物开发涉及生物靶点识别、高通量筛选、先导化合物选择以及严格的临床前和临床试验。
将人工智能整合到这一过程中，可提升每个阶段的效率。
在晚期阶段利用先进的几何深度学习探索分子变异来优化药物候选物，确保在进入临床试验前提高有效性和安全性。

药物发现是解决未满足医疗需求的生命线，为缺乏有效治疗的疾病提供解决方案。它不断扩展治疗选择，使医疗专业人员能够根据患者个体需求定制治疗方案。

成功的药物发现能改善公共健康，并为制药行业带来显著经济效益，推动创新与增长。然而，药物开发成本高昂，许多候选疗法在后期试验中失败。人工智能在药物发现中的整合现已成为变革性力量，重塑传统方法。倡导者预计，人工智能将加速流程、降低成本并提升疗效。

近期突破性成果展示了人工智能在识别对抗耐药细菌（包括臭名昭著的耐甲氧西林金黄色葡萄球菌MRSA）化合物方面的应用。在一项最新研究中，苏黎世联邦理工学院（ETH Zurich）科学家采用尖端几何深度学习技术革新晚期药物开发，提供了一种极具前景的新方法，有望加速和优化药物发现过程。

（图：Boghog）

本文聚焦药物开发各阶段及苏黎世联邦理工学院科学家如何通过高通量实验中的几何深度学习，专门针对晚期药物多样化进行优化。

药物发现各阶段及人工智能整合

药物发现过程复杂，从识别生物靶点到严格的临床试验及上市。以下详细解析各阶段及人工智能的整合：

步骤1：靶点识别

该过程始于识别与疾病相关的特定生物靶点，如蛋白质、酶或遗传因子。传统方法需细致研究已知生物通路、疾病机制及与目标疾病的遗传关联。研究人员通过查阅文献、实验和现有知识确定潜在靶点。人工智能能快速分析复杂相互作用，高效识别潜在靶点，为研究者提供宝贵洞见，加速药物发现早期阶段。

步骤2：高通量筛选

确定靶点后，研究人员系统测试大量化合物库，筛选出与靶点相互作用的分子。高通量筛选法帮助科学家发现可能发展为治疗药物的化合物。人工智能通过预测化合物与靶点的潜在相互作用，加速此过程，简化有前景候选物的识别。机器学习模型可分析分子结构并预测其生物活性。这正是苏黎世联邦理工学院研究团队的重点，下文将详述。

步骤3：先导化合物选择

此阶段从筛选化合物库中甄选出少量有前景的化合物，基于其与靶点的相互作用。这些选定的化合物（称作先导化合物）是后续开发的基石。人工智能通过预测药理特性与疗效、分析分子结构并优先筛选成功候选物，优化先导化合物选择。这加速决策过程，确保资源集中于具备最优特性的化合物，提升药物发现整体效率。

步骤4：临床前与临床试验

选定的先导化合物需经严格临床前测试评估安全性、疗效及副作用，随后进入涉及人体的临床试验。人工智能通过分析临床前与临床数据识别模式及潜在问题。机器学习算法可预测人体试验成功率，优化候选物筛选。最终确定后，药物提交FDA审批并上市。

晚期药物多样化

晚期多样化指对早期阶段已显潜力的先导化合物引入变异或修饰，旨在优化其特性，提升疗效、安全性及整体适用性。此阶段对精炼潜在药物候选物至关重要，确保其在进入高级临床试验前达到最佳状态。

在苏黎世联邦理工学院的研究中，晚期多样化应用了高通量实验中的几何深度学习技术。该创新方法利用先进计算模型分析和操控先导化合物的分子结构，系统探索变异与修饰，识别具有增强治疗潜力的优化衍生物。聚焦晚期多样化旨在战略应对药物开发后期常见挑战，如生物利用度、毒性和整体有效性问题。

（图：NickDiCio）

其目标是通过整合先进计算工具简化药物发现流程，提升效率与效果。

研究方法

苏黎世联邦理工学院研究团队采用几何深度学习技术推动晚期药物多样化，在复杂的分子结构中导航。他们特别聚焦硼化反应，该反应以将含硼基团键合至碳骨架碳原子的能力著称，可激活碳氢骨架。此反应作为变革性催化剂，释放诸多可能性，引入多样化官能团，为开发新活性药物成分（APIs）构建多功能平台。

研究策略性采用分子图表示作为基础框架。该表示将原子与键的三维排列转化为结构化叙事，原子为节点、键为连接边，充当“翻译器”。分子图不仅是视觉辅助，更指引模型理解与生物靶点相互作用的关键空间关系。通过将分子结构转化为图，模型能有效捕获和分析影响化合物行为的结构特征。

核心是图神经网络（GNN），一种专为从图结构数据提取洞见而设计的强力机器学习模型。在此背景下，分子图作为基础输入，使模型能辨识化合物内原子与键的复杂关系。

机器学习模型通过优化特定分子特性的目标函数进行训练，包括结合亲和力、稳定性等关键参数。模型通过此优化目标生成预期具备改进特性的分子结构。研究者进一步引入生成对抗网络（GAN），增添竞争与精炼维度：生成器力求创造分子结构，判别器则严格评估其真实性。这种GAN框架内的互动强化了模型生成新颖优化分子结构的能力，提升药物发现的预测效能。

（图：Mtanti）

积极成果

研究关键在于采用可信文献作为数据源与格式。团队利用两个精心整理的数据集——文献集与实验集，分别涵盖1,301和956个反应。

几何深度学习平台展现卓越预测能力，准确预判六种底物的结果，彰显其在预测类药物分子晚期修饰方面的潜力。实施图神经网络架构（如图变换神经网络GTNN）微妙提升了反应产率预测。

研究发现，表现最佳模型的平均绝对误差为4.23%，即其反应产率预测平均偏差为此百分比；同时达到0.890的皮尔逊相关系数，表明预测产率与实际值呈强正线性关系。简言之，模型能精准预测反应产物量。

整合3D分子图带来显著进展，在多项预测任务中提升神经网络性能。这涵盖从反应产率预测的微幅改进到区域选择性预测的大幅跃升。

文献集与实验集间存在性能差异，归因于数据集异质性与质量。实验集基于一致实验室条件，比文献集的多变环境更利于学习。区域选择性（反应在分子特定位置发生的倾向）预测在90%案例中与文献数据一致，即计算模型能基于文献数据准确预判反应发生位置。

然而，对超出文献集范围的底物，区域选择性预测存在局限，凸显多样化训练数据的必要性。

研究者整理的晚期功能化（LSF）信息库包含结构多样的获批药物、片段及理想化底物。此刻意构建的资源极具价值：库内官能团分析揭示了特定官能团对目标反应结果的细微影响，对药物发现至关重要。

在瑞士罗氏公司（F. Hoffmann-La Roche Ltd）的应用验证了研究影响：几何深度学习平台常规且成功地评估了硼化机会的二元反应结果、反应产率及区域选择性。标准化高通量实验的持续数据生成进一步强化了计算模型的预测能力。

结论

综上，本研究突显了人工智能推动药物发现的重要性。通过整合几何深度学习与高通量实验，该研究强化了晚期药物多样化。平台的预测能力及LSF信息库的战略使用，彰显了人工智能优化药物开发流程的潜力，提升效率，为加速且定制化的药物发现铺平道路。

苏黎世联邦理工学院研究合著者肯尼斯·阿茨（Kenneth Atz）在新闻稿中强调该方法的高效性：“我们的方法能大幅减少所需实验室实验数量。”研究结果凸显人工智能对制药创新的积极影响，代表应对医疗挑战的重要进展。

该研究成果已发表在《Nature Chemistry》期刊上。

【全文结束】

ETH苏黎世科学家如何利用AI加速药物发现Here's how ETH Zurich scientists accelerate drug discovery using AI