全球有超过7000种罕见和未诊断的疾病。尽管每种疾病发生在少数个体中,但这些疾病集体对人类和经济造成了巨大的影响,因为它们影响了全世界约3亿人。然而,只有5%到7%的这些疾病有FDA批准的药物,因此大多数疾病仍然未得到治疗或治疗不足。开发新药是一个艰巨的挑战,但一种新的人工智能工具可以加速从现有药物中发现新疗法,为患有罕见和被忽视疾病的患者及其治疗医生带来希望。
这种人工智能模型被称为TxGNN,是第一个专门用于识别罕见疾病和无治疗方法条件的药物候选者的模型。它从17000多种疾病中识别出了药物候选者,其中许多疾病目前没有任何治疗方法。这是迄今为止任何单一AI模型能够处理的最大数量的疾病。研究人员指出,该模型还可以应用于超过17000种疾病的更多疾病。这项研究于9月25日发表在《自然医学》上,由哈佛医学院的科学家领导。研究人员免费提供了这一工具,并鼓励临床科学家使用它来寻找新的疗法,特别是那些没有或治疗选择有限的疾病。
“通过这个工具,我们旨在识别整个疾病谱的新疗法,但在罕见、极罕见和被忽视的条件下,我们预见到这个模型可以帮助缩小甚至关闭造成严重健康不平等的差距,”主要研究员Marinka Zitnik说,她是HMS布拉瓦尼克研究所生物医学信息学助理教授。“这正是我们看到AI在减少全球疾病负担方面的潜力,通过发现现有药物的新用途,这也是比从头设计新药更快、更经济有效的方法,”Zitnik补充道,她还是哈佛大学肯普纳自然和人工智能研究所的副教授。
新工具具有两个核心功能:一个用于识别治疗候选者及其可能的副作用,另一个用于解释决策的依据。总体而言,该工具从近8000种药物(包括已获FDA批准的药物和目前处于临床试验阶段的实验药物)中识别出了17080种疾病的药物候选者,包括没有可用治疗方法的条件。它还预测了哪些药物会对特定条件产生副作用和禁忌症,而当前的药物发现方法主要是在早期临床试验中通过试错来确定安全性的。
与领先的药物再利用AI模型相比,新工具在识别药物候选者方面平均提高了近50%,在预测药物禁忌症方面准确率提高了35%。
使用已批准药物的优势
重新利用现有药物是一种有吸引力的开发新治疗方法的方式,因为它依赖于已经经过研究、具有明确安全性的药物,并且已经通过了监管审批过程。大多数药物除了最初开发和批准的具体目标外,还有多种效果。但许多这些效果在初始测试、临床试验和审查期间仍未被发现或研究,只有在数百万患者使用多年后才显现出来。实际上,近30%的FDA批准药物在初次批准后获得了至少一个额外的治疗适应症,许多药物在多年后获得了数十个额外的治疗适应症。
这种药物再利用的方法充其量是随机的。它依赖于患者报告的意外有益副作用或医生关于是否将药物用于其未指定条件的直觉,这种做法称为超说明书用药。
“我们倾向于依赖运气和偶然性,而不是策略,这限制了药物发现仅限于已有药物的疾病,”Zitnik说。药物再利用的好处不仅限于没有治疗方法的疾病,Zitnik指出。“即使对于有批准治疗方法的更常见疾病,新药物也可以提供副作用较少的替代方案,或替代对某些患者无效的药物,”她说。
新AI工具为何优于现有模型
目前用于药物发现的大多数AI模型都是针对单一疾病或少数几种情况进行训练的。而新工具的训练方式使其能够利用现有数据进行新的预测。它是通过识别多种疾病之间的共享特征来实现这一点的,例如共享的基因异常。
例如,AI模型基于常见的基因基础识别共享的疾病机制,从而可以从一个已知治疗方法的疾病推断出一个未知治疗方法的疾病。研究团队表示,这种能力使AI工具更接近于人类临床医生在拥有所有现有知识和原始数据的情况下生成新想法的方式,而这些数据是人类大脑无法访问或存储的。
该工具接受了大量数据的训练,包括DNA信息、细胞信号、基因活性水平、临床笔记等。研究人员通过要求它执行各种任务来测试和改进模型。最后,该工具的性能在120万份患者记录上进行了验证,并要求它为各种疾病识别药物候选者。研究人员还要求该工具预测哪些患者特征会使识别的药物候选者对某些患者群体禁忌。
另一项任务是要求该工具识别可能有效阻断某些蛋白质活动的小分子,这些蛋白质参与了致病途径和过程。在一个旨在评估模型是否能像人类临床医生一样推理的测试中,研究人员提示模型为三种罕见疾病找到药物,这些疾病不在其训练数据中,包括一种神经发育障碍、一种结缔组织疾病和一种导致水分失衡的罕见遗传疾病。
研究人员随后将模型建议的药物治疗与当前医学知识中关于建议药物如何工作的知识进行了比较。在每个例子中,工具的建议都与当前医学知识相符。此外,该模型不仅为所有三种疾病识别了药物,还提供了决策背后的理由。这一解释功能增加了透明度,可以增强医生的信心。
研究人员警告说,模型识别的任何治疗方法都需要进一步评估剂量和给药时间。但他们补充说,凭借这一前所未有的能力,新的AI模型将以以前不可能的方式加快药物再利用。该团队已经在与多个罕见疾病基金会合作,帮助识别可能的治疗方法。
致谢、资金来源和披露
共同作者包括Kexin Huang、Payal Chandak、Qianwen Wang、Shreyas Havaldar、Akhil Vaid、Jure Leskovec、Girish N. Nadkarni、Benjamin S. Glicksberg和Nils Gehlenborg。这项工作得到了美国国家科学基金会CAREER奖(资助编号2339524)、美国国立卫生研究院(资助编号R01-HD108794)、美国国防部(资助编号FA8702-15-D-0001)、亚马逊教职研究计划、谷歌研究学者计划、阿斯利康研究计划、罗氏杰出科学家联盟、赛诺菲iDEA-TECH奖、辉瑞研究计划、陈-扎克伯格倡议、HMS约翰和弗吉尼亚·凯内布奖学金、Biswas家族基金会转化计算生物学基金(与米尔肯研究所合作)、HMS院长创新奖(用于人工智能应用)、哈佛大学肯普纳自然和人工智能研究所和HMS苏珊·E·丘奇尔夏季生物医学信息学研究所的支持。
(全文结束)


