科学家利用机器学习加速药物配方开发Scientists use machine learning to fast-track drug formulation development | ScienceDaily

环球医讯 / AI与医疗健康来源:www.sciencedaily.com加拿大 - 英语2025-10-22 04:17:46 - 阅读时长4分钟 - 1908字
多伦多大学研究团队在《自然通讯》发表突破性成果,成功应用机器学习模型指导长效注射药物配方设计。该研究利用lightGBM等算法精准预测药物释放速率,将卵巢癌治疗药物的新配方开发从传统多次试错过程缩短至单次迭代,显著降低药物研发时间与成本。研究同时指出制药科学领域开源数据集匮乏的挑战,并已将数据集公开于Zenodo平台,为人工智能在药物递送系统领域的深度应用奠定基础,有望加速创新疗法向临床转化的进程。
健康药物配方开发长效注射剂机器学习慢性疾病治疗药物释放速率制药科学开源数据集人工智能药物开发加速
科学家利用机器学习加速药物配方开发

多伦多大学的科学家们已成功测试了使用机器学习模型来指导长效注射药物配方的设计。机器学习算法加速药物配方开发的潜力可能会减少药物开发相关的时间和成本,使有前景的新药更快地面世。

该研究今天发表在《自然通讯》(Nature Communications)上,是首批将机器学习技术应用于聚合物长效注射药物配方设计的研究之一。

这项多学科研究由多伦多大学药学科学系的Christine Allen和化学与计算机科学系的Alán Aspuru-Guzik领导。两位研究人员也是加速联盟(Acceleration Consortium)的成员,这是一个利用人工智能和自动化加速发现可持续发展所需材料和分子的全球性倡议。

多伦多大学莱斯利丹药学院(Leslie Dan Faculty of Pharmacy)药学科学教授Christine Allen表示:"这项研究在以数据驱动的药物配方开发方面迈出了关键一步,重点是长效注射剂。我们已经看到机器学习如何在发现有可能成为药物的新分子方面实现了惊人的飞跃式进展。我们现在正在努力应用相同的技术来帮助我们设计更好的药物配方,最终生产出更好的药物。"

长效注射剂(LAI)被认为是治疗慢性疾病最有前景的治疗策略之一,它是一类先进的药物递送系统,设计用于在延长的时间内释放其有效成分,以实现持久的治疗效果。这种方法可以帮助患者更好地遵循用药方案,在注射接近体内作用部位时减少副作用并提高疗效。然而,要在所需的时间内实现最佳的药物释放量,需要通过广泛且耗时的实验来开发和表征各种配方候选物。与更传统的药物配方类型相比,这种试错方法在长效注射剂开发中造成了显著的瓶颈。

多伦多大学化学与计算机科学教授、同时也是多伦多Vector研究所CIFAR人工智能研究主席的Alán Aspuru-Guzik表示:"人工智能正在改变我们进行科学研究的方式。它有助于加速发现和优化过程。这是一个'人工智能之前'和'人工智能之后'的完美例子,展示了药物递送如何受到这种多学科研究的影响。"

为了研究机器学习工具是否能准确预测药物释放速率,研究团队训练并评估了一系列十一种不同的模型,包括多元线性回归(MLR)、随机森林(RF)、轻量级梯度提升机(lightGBM)和神经网络(NN)。用于训练所选机器学习模型的数据集是根据作者和其他研究小组先前发表的研究构建的。

多伦多大学莱斯利丹药学院Allen研究小组的研究助理Pauric Bannigan表示:"一旦我们有了数据集,我们就将其分成两个子集:一个用于训练模型,一个用于测试。然后我们让模型预测测试集的结果,并与之前的实验数据直接比较。我们发现基于树的模型,特别是lightGBM,提供了最准确的预测。"

作为下一步,研究团队应用这些预测并说明机器学习模型如何用于指导新长效注射剂的设计,团队使用高级分析技术从lightGBM模型中提取设计标准。这使得为目前用于治疗卵巢癌的药物设计了一种新的长效注射剂配方。Bannigan表示:"一旦你有了训练好的模型,你就可以解释机器学习学到了什么,并利用这些知识为新系统开发设计标准。"准备完成后,药物释放速率经过测试,进一步验证了lightGBM模型所做的预测。他说:"果然,这种配方具有我们寻找的缓释速率。这一点很重要,因为过去可能需要多次迭代才能得到这样的释放曲线,而使用机器学习,我们一次就成功了。"

当前研究的结果令人鼓舞,表明机器学习有潜力减少对试错测试的依赖,从而加快长效注射剂的开发速度。然而,研究作者指出,制药科学领域可用的开源数据集的缺乏对未来进展构成了重大挑战。Allen表示:"当我们开始这个项目时,我们对使用聚合物微粒的众多研究中报告的数据缺乏感到惊讶。这意味着这些研究及其所付出的工作无法被用来开发我们需要的机器学习模型,以推动这一领域的进步。"她表示:"制药科学领域确实需要创建强大且开放获取的数据库,供所有人使用,这样我们才能共同努力推进这一领域的发展。"

为了促进向支持机器学习更广泛整合到制药科学所需的可访问数据库迈进,Allen和研究团队已将他们的数据集和代码发布在开源平台Zenodo上。

Bannigan表示:"对于这项研究,我们的目标是降低在制药科学中应用机器学习的入门门槛。我们已将数据集完全公开,希望其他人能够在此基础上进行建设。我们希望这成为机器学习在药物配方领域的起点,而不是终点。"

【全文结束】

大健康
大健康