Gero推出ProtoBind-Diff,一种用于靶向小分子发现的无结构AI基础模型Gero Launches ProtoBind-Diff, a Structure-Free AI Foundation Model for Targeted Small Molecule Discovery

环球医讯 / AI与医疗健康来源:www.santelog.com新加坡 - 英文2025-06-25 22:00:00 - 阅读时长4分钟 - 1904字
Gero公司推出了一款基于蛋白序列而非3D结构生成小分子的AI模型ProtoBind-Diff,该模型在药物研发领域具有广泛应用前景,特别是在针对低数据或无结构信息的目标蛋白上表现出色,为慢性病和抗衰老研究提供了新工具。
GeroProtoBind-DiffAI基础模型小分子生成药物发现衰老慢性疾病健康肿瘤学免疫学传染病
Gero推出ProtoBind-Diff,一种用于靶向小分子发现的无结构AI基础模型

Gero公司推出了一款名为ProtoBind-Diff的新型AI基础模型。该模型能够仅根据蛋白质的氨基酸序列生成类似药物的小分子,而无需依赖3D结构信息。在预测结合强度方面,ProtoBind-Diff的表现与领先的基于结构的工具相当,同时还能生成新颖且化学多样性丰富的化合物。

新加坡,2025年6月25日(GLOBE NEWSWIRE)——专注于衰老和慢性疾病的生物技术公司Gero今日宣布推出ProtoBind-Diff,这是一种基于掩码扩散语言模型的小分子生成工具,仅需蛋白质序列即可生成小分子。该模型通过训练超过一百万对活性蛋白质-配体对开发而成,代表了分子生成领域的范式转变。与基于结构的模型不同,后者受限于少量且存在偏差的已解析蛋白质-配体复合物数据,ProtoBind-Diff则利用公共数据库中更广泛可用的活性数据进行训练。这使得模型能够在更广泛的化学和生物学空间中学习,从而更好地推广到那些缺乏结构数据或完全未知的目标蛋白。

Gero在bioRxiv上发布了一篇新的预印本论文,详细介绍了该模型的性能和设计。

“设计能够靶向特定蛋白质的小分子是药物发现领域最困难的问题之一。传统建模方法难以应对这一挑战,因为能量尺度、极化效应以及蛋白质动力学的复杂性使得高分辨率预测几乎不可能实现。但也许我们问错了问题,”Gero首席执行官兼联合创始人彼得·费迪切夫博士(Peter Fedichev)表示,“自然界已经解决了这个问题——进化优化了一种生化语言,这种语言编码了蛋白质和分子之间的相互作用。通过ProtoBind-Diff,我们正在挖掘这一点。它是一种从序列而非结构中学习的语言模型。它不模拟物理,而是从一百万个真实例子中学习生物活性的‘语法’。”

ProtoBind-Diff被开发为Gero生成式药物发现平台的核心组件。该模型利用预训练的蛋白质嵌入(ESM-2)和去噪扩散框架,仅通过序列级信息即可生成化学上有效且新颖的SMILES格式分子。

预印本中的关键结果包括:

  • 在使用Boltz-1(一种神经网络,用于预测蛋白质-配体复合物并评分其结合质量)进行的结构感知基准测试中,ProtoBind-Diff的表现与基于结构的模型(如Pocket2Mol、TargetDiff)具有竞争力,无论是在充分表征的(“简单”)目标还是数据稀少的(“困难”)目标上,均表现优异。
  • 出现了解释性特征,尽管在训练过程中没有接触过3D结合位点注释,注意力头仍能对齐到已知的结合残基。
  • 生成分子具有高新颖性、类药性和可合成性,这些特性通过结构相似性、类药性和可合成性指标进行衡量。
  • 开源版本已在GitHub上发布,完整模型和代码库的公开演示版可通过

ProtoBind-Diff通过经典对接方法(AutoDock Vina)和结构感知深度学习模型进行了基准测试。此外,ProtoBind-Diff还使用了受AlphaFold 3启发的开源神经网络Boltz-1进行评估。Boltz-1扩展了诺贝尔奖认可的蛋白质结构预测突破能力,使其能够建模蛋白质如何与小分子结合,提供了一种可扩展的、结构感知的结合强度评估指标。该模型在活性化合物富集方面表现出色,尤其是在结构数据极少或已知配体较少的目标上。在某些情况下,其Boltz-1富集因子甚至超过了基于结构训练的模型,表明该模型能够从序列嵌入中学习空间先验知识。

“我相信,我们只是朝着创建理想生成模型迈出的第一步。是的,在我们的基准测试中,ProtoBind-Diff模型的表现优于一些现有的3D结构模型,”Gero高级研究员康斯坦丁·阿夫恰乔夫博士(Konstantin Avchaciov)表示,“话虽如此,我坚信随着我们继续扩展数据集以涵盖更多样化的蛋白质类别,未来我们将取得显著更好的结果。”

ProtoBind-Diff的发布符合日益增长的对人类相关、无结构限制的药物发现方法的兴趣,尤其是在流行病应对、被忽视疾病靶点以及具有内在无序区域的蛋白质等领域。

Gero已将ProtoBind-Diff整合到其内部发现管道中,并正在积极寻求合作伙伴,将该模型应用于肿瘤学、免疫学、传染病和衰老相关疾病的协作项目中。

关于Gero

Gero是一家致力于开发与年龄相关疾病和长寿相关的新型疗法的生物技术公司。该公司结合专有生物数据集和AI驱动模型来理解和减缓衰老过程,最终延长健康的人类寿命。Gero还与辉瑞(Pfizer)合作开发纤维化疾病的治疗方法,作为其更广泛使命的一部分,旨在针对衰老的根本原因。欲了解更多信息,请访问gero.ai。


(全文结束)

大健康
大健康