利用AI就绪型蛋白质-配体数据推动药物发现Powering drug discovery through AI-ready protein–ligand data | EMBL

环球医讯 / AI与医疗健康来源:www.embl.org英国 - 英语2026-01-28 07:33:54 - 阅读时长3分钟 - 1079字
由欧洲分子生物学实验室-欧洲生物信息研究所参与的跨国公私合作项目LIGAND-AI正式启动,该项目将生成规模空前的开放性标准化蛋白质-配体相互作用高质量数据集,重点针对罕见病、神经系统疾病及肿瘤学等未满足医疗需求领域,通过整合先进实验技术与计算方法建立预测管道,使全球研究人员能开发训练预测分子相互作用的AI模型,计划至2035年为人类蛋白质组中每个蛋白质开发药理学调节剂,其中EMBL-EBI将负责通过BioStudies和ChEMBL数据库向全球科学界开放数亿条实验数据记录,填补当前未充分研究靶点的数据空白。
LIGAND-AI蛋白质-配体相互作用药物发现AI模型Target2035罕见病神经系统疾病肿瘤学开放科学化学探针ChEMBL数据库
利用AI就绪型蛋白质-配体数据推动药物发现

LIGAND-AI项目将以前所未有的规模生成开放、标准化、高质量的蛋白质-配体相互作用数据集

一项名为LIGAND-AI的新型跨领域公私合作项目,将生成大型开放、高质量的蛋白质-配体相互作用数据集,并利用这些数据训练人工智能(AI)模型,以预测可与数千种人类蛋白质结合的类药物分子。该项目由创新健康倡议组织(IHI)资助,汇集了包括欧洲分子生物学实验室-欧洲生物信息研究所(EMBL-EBI)在内的18家合作伙伴。

在辉瑞公司和结构基因组联盟(SGC)的主导下,LIGAND-AI将研究与现有疾病领域及未满足医疗需求相关的数千种蛋白质,涵盖罕见病、神经系统疾病和肿瘤学病症。

早期药物发现是一个漫长、昂贵且不确定的过程。科学家需耗费数年时间测试数千种分子,才能找到一种与疾病相关蛋白质结合的分子。LIGAND-AI旨在通过整合先进实验室技术与计算方法,建立从实验到预测的全流程管道,从而改变这一现状。

该联盟将运用互补筛选技术生成数十亿条数据记录,使全球研究人员能够开发、训练和验证预测分子相互作用的AI模型。

结构基因组联盟首席执行官兼项目协调员Aled Edwards表示:"本项目汇集了开放科学生态系统中跨学科的科学家和企业,令人欣慰的是看到这些多元科学社区围绕共同愿景开展合作,向全球公开共享有价值的化学数据。"

Target 2035计划

LIGAND-AI是Target 2035全球开放科学计划的重要组成部分。该计划通过跨领域研究人员合作推进人类蛋白质研究的分子工具开发。Target 2035通过促进公私合作伙伴关系协作,旨在到2035年为人类蛋白质组中的每个蛋白质开发药理学调节剂。

罕见病新药物靶点

由于缺乏研究蛋白质生物学所需的化学工具,大量人类蛋白质仍未被充分探索。这一缺口限制了包括罕见病在内的多个人类健康领域的研究。LIGAND-AI项目将聚焦这一挑战,为这些被忽视的蛋白质生成大规模、公开可用的潜在化学探针数据集。

欧洲分子生物学实验室-欧洲生物信息研究所将在确保LIGAND-AI数据开放获取方面发挥核心作用,通过归档这些大规模数据集并将验证结果整合至ChEMBL数据库来实现。

欧洲分子生物学实验室-欧洲生物信息研究所化学生物学资源团队负责人Noel O’Boyle表示:"项目采集的原始数据将添加至BioStudies数据库,所有经验证的阳性结果将存入ChEMBL并向科学界公开。对于这些研究不足的靶点,目前根本不存在此类数据。"

完整新闻稿详见结构基因组联盟网站。

【全文结束】