在这篇博客中,我们将讨论以下几个方面:
- AI驱动的目标识别是如何工作的
- AI药物发现的局限性及其需要注意的问题
- AI驱动的目标识别示例
- Atomwise
- Deep Genomics
- AI驱动的药物发现不会消失
过去五年中,投资于AI赋能的药物发现的资金每年翻一番,从2020年的24亿美元激增至2021年底的超过52亿美元。毫无疑问,药物发现最根本的是我们如何管理疾病模型和识别需要研究的目标。人类的选择推动了这一发现,但这种手动程序使得发现过程缓慢且依赖直觉,有时甚至需要几十年的时间。
直到COVID-19疫苗的出现,最快的研发记录是由麻疹疫苗保持的,耗时四年。大多数疫苗需要十年或更长时间。AI算法被开发出来,用于筛选庞大的分子结构数据库,并预测哪些化合物可能有效针对病毒。这为我们提供了在不到一年的时间内开发疫苗所需的竞争优势。通常情况下,一种药物要进入市场需要12到18年的时间,平均成本为26亿美元。高成本直接导致了药物开发中90%的失败率,这些候选药物从未进入临床试验阶段。生成式AI已经证明了其在加速和改进药物发现过程中的价值。迄今为止,它主要集中在新药设计上。
AI驱动的目标识别如何工作
虽然我们在新药分子的研究上一直很忙,但这项技术在药物再利用方面也有巨大的潜力。药物再利用是指现有的药物可以有效地治疗它们最初未被设计来治疗的病症。医生偶尔会偶然发现某些药物的非传统用途,例如,抗抑郁药盐酸安非他酮被发现有助于戒烟,这是一个幸运的发现。
如果我们让AI对现有的药物进行分析,我们可能会发现数十甚至数百种新的应用,而且开发费用相对较低。在药物发现的目标识别阶段,AI正在使用广泛的数据集进行训练,包括:
- 组学数据
- 表型和表达信息
- 疾病相关性
- 来自临床试验、研究资助、专利、出版物等的信息
这种训练有助于理解疾病的生物学基础,并隔离出可能作为对抗这些疾病目标的新蛋白质或基因。面对地球上存在的3亿种蛋白质,了解任何一种个体蛋白质的结构可能需要数年时间和数百万美元的投资。AI的介入改变了这一局面,2021年发布的AlphaFold达到了90%的准确率,能够预测极其复杂的蛋白质结构。AI不仅限于目标识别,还可以预测目标的3D结构,并加速设计与其结合的适当药物。
在制药研发中选择新的生物分子药物靶点(目标选择/优先级)仍然存在不确定性。尽管大多数治疗方法通过蛋白质靶点起作用,但新的方法为疾病治疗带来了希望。药物靶点是与治疗剂相互作用的物质实体,通常是大分子。然而,非天然靶点也具有潜力,包括金属、脂质、干细胞、糖类和非人类靶点。绘制已批准药物与其效力靶点之间的相互作用既具有信息性,也是不可或缺的。目前,只有11%的人类蛋白质组用小分子探针进行了探索。由于高度特异性工具(如抗体和化学探针)之间缺乏互换性,大约33%的蛋白质组仍未得到充分研究。
在处理目标优先级时,基于网络的方法(如知识图谱)正日益突出,用于推断新的蛋白质-表型或蛋白质-功能关联。MetaPath是一种利用此类网络的技术,有助于优先排序药物靶点。使用AI/ML技术优化处理大量数据集,可以检测导致疾病的遗传变异,即使触发基因尚未确定。数据集成和AI/ML算法的进步有望改变目标选择和优先级,引入无偏见的方法。
尽管这为整个行业创造了巨大的机会,但仍需考虑以下几点:
AI药物发现的局限性及其需要注意的问题
对去年AI驱动药物发现进展的分析显示,没有由AI生成的分子成功从发现阶段过渡到临床开发。AI加速了药物靶点的识别和新分子的发现。尽管如此,一些临床试验的结果令人失望。2023年,AI候选药物未能在临床试验中达到预期效果,涉及的疾病包括特应性皮炎、精神分裂症和癌症。
GE医疗首席AI官Parminder Bhatia指出,生成式AI目前扮演的关键角色与十年前云计算的角色有惊人的相似之处。他对多模态模型的潜力表示热情,微软医疗与生命科学首席技术官John Doyle也是如此。他们都承认跟上信息洪流的挑战。Owkin首席研发官Jean-Philippe Vert强调,大多数出版物缺乏同行评审;个人可以自由在线发布他们的发现。区分AI发展中诚实的进步与噪音需要广泛的专家知识。
在期望与谨慎怀疑的持续互动中,组织正在合作制定负责任的AI框架。这一回应源于欧洲和美国监管机构关于在整个药品生命周期中使用AI的讨论文件。
AI驱动的目标识别示例
剑桥大学——识别与神经退行性疾病相关的新靶点
剑桥大学的一支研究团队领导了一项创新方法,旨在确定与蛋白质相分离相关的疾病治疗靶点。这是一种最近揭示的现象,对多种生物过程至关重要。与AI驱动的药物发现公司Insilico Medicine合作,剑桥团队开发了一种巧妙的方法,用于发现新的药物开发靶点。这些靶点涉及因蛋白质相分离失调引起的疾病。通过操纵这些靶点,研究人员成功复制了细胞中的疾病特征。他们的发现详细记录在《美国国家科学院院刊》(PNAS)上。
Atomwise
这是一家值得敬佩的公司!Atomwise每天评估超过1亿种化合物,使用其深度卷积神经网络。他们是药物发现领域的领先者,致力于通过超级计算机削减药物开发的成本。通过利用庞大的分子结构数据库,他们使用高级算法预测潜在药物的有效性,而无需化学家准备第一个试管。不再需要耗费数周时间进行试错猜测,以排除可能性。相反,可以列出具有成功所需特性的分子。面对疾病的致命性,Atomwise在2015年调查了现有药物,看看是否可以重新设计以应对埃博拉疫情。他们在一天内发现了两个有前途的候选药物,而传统的调查需要数年时间。尽管如此,埃博拉病毒感染的50%平均死亡率迅速消耗当地人口,使疾病自行消亡。他们的发现仍将在未来的疫情中发挥作用。未来,这种调查将在地方药店层面进行,由AI驱动,根据个人基因组创建定制药物。一个人将获得与另一个患有相同疾病的患者不同的药物,因为这种药物对他们更有效。在此之前,可以在药店层面进行临床研究。这将减少开销和人员成本,加快结果速度,并消除许多住院临床试验中的错误。随着知识的扩展,甚至副作用也应最小化或消除。
Deep Genomics
或许有些轻松地说,AI进行药物发现的想法并不罕见,甚至不被反对。生物化学是一个极其复杂的领域,AI比人类更适合。Deep Genomics专注于RNA疗法,因为这些较小的DNA样分子非常灵活。RNA可以设计成解决特定的遗传疾病,尤其是那些永远不会获得资金或关注的极罕见疾病。此外,它们可以用作疫苗,如在COVID危机期间拯救世界的mRNA。到目前为止,Deep Genomics利用其计算能力编制了一个数据库,提供超过3亿个可能影响遗传密码的遗传变异预测。2018年,其专有的AI平台确定了初始目标,其中RNA剪接既是缺陷又提供了纠正机制。到2023年,他们推出了首个基础模型。
AI驱动的药物发现不会消失
无论是在临床环境中还是在药店层面进行的药物试验,都能够根据生成的结果快速调整。当前的CRO模型收集冷藏样本,将其运输到其他地方进行分析和评估。结果通常在患者队列解散很久之后才可用。能够在试验中途改变方向可以在多次试验中节省几个月甚至几年的时间。企业当然希望成功并获利。然而,AI在药物发现中的最终受益者将是患者,他们的医疗结果将显著改善。即使是一个小分子也很复杂,因此AI对于更快、更便宜、高效地产生可靠结果至关重要。AI驱动的药物发现不会消失。有许多新的参与者准备崭露头角。目前有很多资金,伴随着迅速成熟的技术,推动这一进程。至少有250个“竞争者”希望赢得这场比赛,还有很多拥有大量资本的支持者。现在,大多数研究者在美国,但东南亚和西欧也开始迎头赶上。您几乎肯定也应该参与其中。
(全文结束)


