SandboxAQ是一家从谷歌母公司Alphabet分拆出来的人工智能初创公司,并得到了Nvidia的支持。本周三,该公司发布了一大批数据,希望借此能够加速新药的研发进程。这些数据旨在帮助科学家理解药物如何与蛋白质结合。
其目标是帮助科学家预测某种药物是否会与其在人体中的目标结合。尽管这些数据有真实世界科学实验的支持,但它们并非来自实验室。相反,SandboxAQ通过使用Nvidia的芯片生成了这些数据。这家公司已经筹集了近10亿美元的风险投资资金。它计划将这些数据反馈到AI模型中,希望科学家能够利用这些模型快速预测小分子药物是否会与研究人员所针对的蛋白质结合,这是任何候选药物进入下一阶段之前必须解决的关键问题。
例如,如果一种药物旨在抑制某种生物过程(如疾病的进展),科学家可以使用这一工具来预测药物分子是否可能与参与该过程的蛋白质结合。
这种方法是一种新兴领域,结合了传统的科学计算技术与人工智能的进步。在许多领域,科学家长期以来都拥有可以精确预测原子如何组合成分子的方程式。
然而,即使对于相对较小的三维药物分子,潜在的组合数量也变得过于庞大,以至于无法手动计算,即便使用当今最快的计算机也是如此。因此,SandboxAQ的做法是利用现有的实验数据,计算出大约520万个新的“合成”三维分子——这些分子虽然尚未在现实世界中被观察到,但基于真实世界数据的方程式进行了计算。
SandboxAQ公开发布的这些合成数据可以用来训练AI模型,使得科学家能够在极短的时间内预测一种新药分子是否可能与研究者的目标蛋白质结合,同时保持高精度。而SandboxAQ将对其利用这些数据开发的AI模型进行收费,他们希望这些模型能达到与实际实验室实验相媲美的结果,但却以虚拟方式进行。
“这是我们多年来作为行业一直在努力解决的一个生物学长期问题,”SandboxAQ的AI模拟总经理纳迪亚·哈伦(Nadia Harhen)周二对路透社表示,“所有这些通过计算生成的结构都被标记为真实的实验数据,因此当你选择这个数据集并训练模型时,实际上可以以前所未有的方式使用这些合成数据。”
(全文结束)


