伊利诺伊大学研究人员创建AI驱动的药物开发工具UI researchers create AI-powered drug development tool - The Daily Illini

环球医讯 / AI与医疗健康来源:dailyillini.com美国 - 英语2025-11-15 23:11:51 - 阅读时长5分钟 - 2148字
伊利诺伊大学工程学院赵惠民(Huimin Zhao)和迪瓦卡尔·舒克拉(Diwakar Shukla)教授团队开发出名为EZSpecificity的AI模型,该工具通过分析酶与底物的结合关系加速药物研发进程。该模型采用交叉注意力算法处理酶-底物复合物结构,实验验证中识别潜在反应底物的准确率达91.7%,显著优于现有AI模型58.3%的水平。研究人员计划将工具开源共享并已申请专利,未来将通过扩充训练数据集和整合吉布斯自由能等反应能量参数,提升模型在酶工程、合成生物学及药物发现领域的普适性和预测精度,有望大幅降低新药研发成本和时间。
健康AI驱动药物开发工具EZSpecificity模型酶-底物结合合成生物学机器学习药物发现酶工程生物催化实验验证开源工具
伊利诺伊大学研究人员创建AI驱动的药物开发工具

工程学院教授赵惠民(Huimin Zhao,左)和迪瓦卡尔·舒克拉(Diwakar Shukla,右)开创了一种由人工智能驱动的合成生物学工具。他们希望该技术将推进药物开发及相关领域的发展。

该校研究人员创建了一种名为EZSpecificity的人工智能模型,用于测试特定酶与底物之间的结合程度。

工程学院的赵惠民(Huimin Zhao)和迪瓦卡尔·舒克拉(Diwakar Shukla)两位教授致力于开发EZSpecificity模型——一种将化学品与特定酶匹配的AI系统。他们表示,该工具可用于推进药物开发和合成生物学。

赵惠民的研究重点是利用合成生物学和机器学习创建新型化学反应机制。舒克拉的研究则集中在使用基于物理的模型和技术来解释复杂的生物过程。

机器学习是一种人工智能形式,它能利用给定数据并从中"学习"以对数据做出预测。合成生物学则是重新设计分子,使它们能够生产新产品,例如药物。

EZSpecificity是什么,它是如何工作的?

酶是帮助加速化学反应的蛋白质。它们作用于称为底物的化学化合物以促进这些反应。人体执行的许多日常生物功能都是由酶催化或加速的反应。

据赵惠民介绍,EZSpecificity模型可用于寻找开发新药化学品的途径,或为酶找到最佳底物。该模型利用人工智能预测哪些化学品可以成为哪些酶的底物。

赵惠民表示,通常不清楚哪种底物适用于特定的酶。EZSpecificity,他希望,能帮助研究人员解决这一问题。

"在细胞内部,有时你不知道哪些酶真正催化哪些反应——而我们也可以帮助弄清楚代谢过程,"赵惠民说。

理解特定的酶-底物关系有助于推进药物发现和其他生物研究。赵惠民进一步表示,该技术可应用于包括酶工程、合成生物学和生物催化在内的广泛领域。

舒克拉表示,确定哪些化学品可以被修改需要非常广泛的实验,因为制造酶和化学品并测试它们既繁琐又精确。他补充说,一个高效率的人工智能工具对研究人员和公众都极其有价值。

"如果你想制造某种特定的化学品、产品或某种药物,你可以预测哪种酶能生产该产品以及需要什么样的反应物,"舒克拉说。

它是如何训练的?

EZSpecificity模型使用两个数据集进行了训练:PDBind+和ESIBank。这些数据集结合了大量关于酶、底物及其反应的信息,使模型能够进行训练并提高准确性。

"在我们尝试使用分子对接和模拟进行预测时,我们试图预测哪种底物与哪种酶结合,"舒克拉说,"然后,我们创建了这个纯粹计算的酶-底物配对的大型数据库。"

这种大规模计算建模为理解酶-底物相互作用的分子基础奠定了基础。

"然后(EZSpecificity模型)也理解了正在发生的相互作用类型,因为一旦你有了物理模型,你实际上可以理解允许这种底物与酶结合的相互作用,"舒克拉说,"这个计算数据集比实验数据集大得多;当你同时对两者进行训练时,你会得到一个更准确的模型。"

双重输入算法指导模型

该模型使用一种称为交叉注意力(cross-attention)的算法,该算法作用于两个不同的输入序列:源序列和目标序列。该算法通常用于大型语言模型的解码器层中,其中源序列是上下文,目标序列是正在生成的序列。

在EZSpecificity的情况下,这描述了特定底物化学基团和酶氨基酸残基之间的相互作用。给定酶-底物复合物(源序列),该模型预测两者之间的特定相互作用。

"(它)会预测如果你提供一个酶-底物复合物的结构,会发生什么样的氨基酸和化学基团相互作用,"舒克拉说。

赵惠民和舒克拉的研究论文指出,EZSpecificity模型在实验验证中识别单一潜在反应底物的准确率达到91.7%。这一结果明显高于另一个AI模型ESP的58.3%准确率。

舒克拉和赵惠民寻求分享该工具

据舒克拉介绍,这对搭档目前正在制定一个网站的计划,该网站将是开源的并向公众开放。

"我们希望这个网站未来能有很多功能,"舒克拉说,"你可以访问我们的网站并直接使用它,开源无限制——但我们确实拥有它的专利。"

赵惠民表示,他目前正在大学的分子制造实验室研究所实施EZSpecificity。

未来方向

研究人员的主要担忧之一是该模型的准确性不够高。

"在论文中,我们展示了用作示例的卤化酶,"赵惠民说,"准确性相当好,超过95%、90%,但对于其他酶,准确性较低,我们需要获取更多数据来训练模型,以便它能以更高的准确性普遍适用。"

舒克拉表示,应该添加更多关于模型预测的拟议反应特性的信息。更具体地说,该模型不包括反应的能量信息,如吉布斯自由能——用于驱动反应的总能量。

"现在我们说的是,'哦,这是底物',或'不是底物',但如果它能开始预测动力学参数或化学物质转化速率以及其他类似的定量测量……那就是下一步,"舒克拉说,"如果你能将这类实验和计算信息整合到工具中……一个高度准确的模型将非常有用。"

【全文结束】

大健康
大健康