药物发现者是英伟达(Nvidia)最近推出的 NVIDIA NIM Agent Blueprints 的目标客户之一。这是预训练、可定制的工作流程,使企业级用户能够创建自己的人工智能(AI)应用程序。[英伟达]
基于云原生“微服务”的 NIM Agent Blueprint 旨在使用生成模型加速小分子的虚拟筛选。
药物发现者是英伟达最近推出的预训练、可定制工作流程目录的目标客户之一,该目录使企业级用户能够创建自己的人工智能(AI)应用程序。
NVIDIA NIM Agent Blueprints 是参考工作流程,旨在帮助药物发现者和其他客户构建和部署生成式人工智能应用程序,用于虚拟筛选、信息检索甚至客户服务化身等用途。
该蓝图结合了 NVIDIA NIM 或优化的云原生“微服务”,旨在让开发人员在任何地方(无论是本地工作站、内部数据中心、云服务还是 GPU 加速的工作站)加速生成式 AI 模型的部署。(NIM 代表“NVIDIA 推理微服务”)
通过使生物制药公司从传统的固定数据库筛选转向生成式 AI 驱动的分子设计和预优化,NIM Agent Blueprints 旨在帮助研究人员更快地设计出更好的分子。据英伟达称,这代表了药物发现过程中的范式转变,特别是在“命中”化合物向“先导”化合物的转化过程中,这些化合物经过优化以进行进一步开发。
“我访问的许多制药公司在其库中有 6000 万个分子。这就是他们正在筛选的对象,那 6000 万个静态分子。但在化学空间中可能有 10 的 60 次方个潜在分子可能是一种疗法,”英伟达医疗保健业务发展经理金伯利·鲍威尔(Kimberly Powell)告诉 GEN Edge。
“这里的范式转变是生成式 AI 正在做的事情,尤其是 MolMIM 系统正在做的事情,是利用生成效应,智能地搜索化学空间,以便世界上从未合成过的分子可以具有您真正关心的特征,”鲍威尔说。
对于药物开发者来说,英伟达表示,名为生成式虚拟筛选的 NIM Agent Blueprint 通过使用生成模型加速小分子的虚拟筛选,有助于实现人工智能长期以来减少开发新疗法的时间和成本的承诺。
通过三个 AI 模型改进“命中”
该蓝图以更智能、更高效的方式识别和改进虚拟“命中”化合物——通过筛选确定为具有潜在生物活性的化合物。生成式虚拟筛选的核心是三个基本的 AI 模型:
- AlphaFold2,由谷歌 DeepMind 开发的用于蛋白质折叠的 AI 模型。AlphaFold2 可以从氨基酸序列以原子级精度预测蛋白质的 3D 结构。
- DiffDock,分子对接模型,旨在预测小分子配体与蛋白质的结合结构,同时优化多个特性,如高溶解度和低毒性。
- MolMIM,生成化学模型,生成针对用户定义的特性进行优化的候选药物。MolMIM 还可以设计针对特定蛋白质靶标进行优化的分子。
每个 AI 模型都封装在 NIM 中,将微服务集成到灵活、可扩展的生成式 AI 工作流程中。该蓝图使用生成式 AI 方法为所需的治疗特性预优化分子。
“虚拟筛选仍然只是药物发现的一部分。但我们正在研究涵盖从目标发现到先导识别的模型。并且我们将沿着药物发现过程构建蓝图,”鲍威尔说。
“计算机辅助药物发现真的会在整个过程中看到生成式 AI 的注入,”她解释说。“很多时候,计算机辅助药物发现被认为是在先导识别优化中,我们在那里进行了很多模拟。但现在我们从目标 ID 到先导优化都使用了很多计算方法。”
其他专注于药物发现的 NVIDIA NIM 包括:
- ESMFold,一种“Transformer”模型——一种通过跟踪顺序数据中的关系来学习上下文从而理解含义的神经网络——它可以根据单个氨基酸序列准确预测蛋白质结构。
- Parabricks DeepVariant(通用变体调用微服务背后的工具),一种深度学习模型,旨在帮助识别短读和长读测序数据集中的变体。Parabricks 旨在为基因组分析工作流程中的变体调用提供比在中央处理器(CPU)上运行的原始或“香草”DeepVariant 实现快 50 倍的速度提升。
“我们通常有四到五个可用的 NIM,还有很多其他药物发现和医疗保健 NIM 正在预览中。我们将非常积极地宣布和部署这些应用程序。每个月,您都会看到新的丰富的 NIM 和蓝图,”鲍威尔说。
数字人类、PDF 数据提取
除了药物发现蓝图,其他 NIM Agent Blueprints 还包括用于从数字健康到客户服务等用途的数字人类工作流程;以及用于企业检索增强生成(RAG)的多模式 PDF 数据提取工作流程,旨在从大量业务数据中生成更准确的响应。
据英伟达称,RAG 可以读取任何 PDF 中的图像,并根据所看到的内容提供见解。
“在生物医学研究的医疗保健行业中,我们与保险公司所做的一切,所有患者和医生的互动,到处都有包含大量有用信息的 PDF。现在我们将能够提取并总结它,”鲍威尔说。
数字人类工作流程(也可应用于数字健康)使用能够自动语音识别的定制化身,例如英伟达的交互式数字人类“詹姆斯(James)”。人类语音被转换为文本,进入语言模型,然后进入 RAG 系统,返回语音合成,并激活用户的化身。
“如果您完成这个完整的循环,您现在就拥有了一个真正能够理解、推理和响应的数字人类的代表,并且还可以使用 Audio2Face NIM,”鲍威尔说。“您可以见到詹姆斯,当文本转换为语音返回时,您实际上会在脸上看到不同的表情,并且能够进行更引人入胜的对话。”
这些蓝图可供开发人员免费下载,并可以与 NVIDIA AI Enterprise 软件平台一起部署。
包括该领域前 20 名在内的生物制药公司正在通过全球系统集成商和技术解决方案提供商(包括埃森哲、德勤、SoftServe 和 World Wide Technology(WWT))访问 NVIDIA NIM Agent Blueprints,思科、戴尔技术、惠普企业和联想正在提供全栈 NVIDIA 加速的基础设施和解决方案,以加快 NIM Agent Blueprints 的部署。
埃森哲计划通过与生物制药公司合作,根据药物开发项目的特定需求定制 NIM Agent Blueprint,以优化 MolMIM NIM 内的分子生成步骤。
亚马逊网络服务(Amazon Web Services)的 AWS HealthOmics——旨在帮助生物制药公司和医疗保健系统存储、查询和分析基因组、转录组和其他组学数据的服务——正在提供构成蓝图的所有三个 NIM,目的是简化将 AI 集成到现有的药物发现工作流程中,英伟达说。


