你的药柜中的每种药物、手机电池中的每种材料,以及支撑现代生活的几乎所有化合物,最初都源于分子层面的猜测——科学家假设特定的原子排列可能产生有用效果,例如杀死细菌感染、储存电荷或高效吸收阳光。然而,面对海量潜在小分子,寻找能解决疾病或推动技术进步的正确组合极具挑战性,这种大海捞针式的搜索往往耗时数十年。
近年来,人工智能工具已显著缩短这一过程。生成式AI模型可根据目标属性提出分子结构,将过去需数年试错的工作压缩至数小时计算。研究团队现已开发出更先进的方法:PropMolFlow(属性引导分子流)能以现有方法约10倍的速度生成分子候选方案,且不牺牲结果的准确性或化学有效性。由佛罗里达大学和纽约大学科学家主导的这项突破发表在《自然计算科学》期刊上。
"科学史上的大部分时间,材料发现往往先于理论理解——有用化合物常因偶然被发现,随后科学家才研究其原理,"纽约大学物理、化学、数学与神经科学助理教授、论文作者斯特凡诺·马丁尼亚尼(Stefano Martiniani)表示,"生成式AI逆转了这一逻辑:先指定属性,再寻找结构。PropMolFlow正推动这一愿景走向实用。"
"对计算速度直接决定发现速度的领域而言,这是实质性进步,"佛罗里达大学化学系助理教授、论文作者刘明杰(Mingjie Liu)补充道,"该工作并非取代前人成果,而是证明新一代分子生成器能在保持工具实用性的高精度前提下,实现显著提速。"
逆向分子设计
包括明尼苏达大学和杨百翰大学研究者的论文作者指出,分子设计本质上是"逆问题"。"化学家通常不需要'任意分子',"马丁尼亚尼解释道,"他们需要能执行特定功能的分子——例如在光学应用中与光强烈互动,或具备决定吸能/导电特性的电子结构。"
AI进步使这类定向设计成为可能。传统药物与材料发现通常基于已知知识——调整现有化合物或搜索已合成分子目录。生成式AI则能从零创造全新结构,探索前所未有的化学可能性。自2022年研究人员首次证明DALL-E类图像生成AI可改造用于构建三维分子结构以来,该能力迅速发展。每代新方法都在提升属性定向精度、生成结构的化学有效性或生成速度。
PropMolFlow通过创新算法同步优化三者:它找到从随机噪声到有效分子结构的更直接路径,将计算步骤从先前方法的1000步减少至约100步。
速度与精准并重
研究者意识到,若生成分子化学上无意义或偏离目标属性,速度便毫无价值。因此他们通过对比测试PropMolFlow的准确性,发现该方法在结构有效性上持续优于基线模型:超90%的生成分子具备正确键合模式与合理几何构型。
"这至关重要,因早期许多方法产生的结构表面合理却违反基础化学规则,"马丁尼亚尼强调。同样,PropMolFlow能精准呈现目标分子属性,在多项分子特性上达到或超越最佳现有方法的精度,且计算速度显著更快。
AI作业的独立验证
基于AI的分子设计面临根本性挑战:评估机制。"若神经网络生成分子,另一网络预测其属性,两者可能因共享信息源而存在相似盲点——相当于AI自行批改作业,"马丁尼亚尼指出。PropMolFlow团队采用密度泛函理论解决此问题,这种基于物理的量子化学方法从第一性原理计算分子属性,完全独立于机器学习模型。
多数属性中,神经网络预测与物理计算高度吻合,证实快速AI评估在统计上可靠。"此类验证使生成分子获得实际应用所需的可信度,"刘明杰表示。
技术赋能前景
作者总结,PropMolFlow展现的速度与精度组合对分子发现具有实践意义。"现在研究人员能在数分钟而非数小时内生成数千个化学有效且属性定向的候选分子,从而加速迭代:生成候选物、计算筛选、用物理实验验证最优解,并将结果反馈以优化下一轮,"马丁尼亚尼解释。
"真实药物和先进材料通常比我们探索的分子更大更复杂——将此类方法扩展至更大系统仍是活跃挑战,"刘明杰承认,"但核心原理可迁移,属性嵌入的严谨处理与基于物理的验证为更宏大应用提供了模板。"
参考文献: Zeng C, Jin J, Ambrose C, et al. PropMolFlow: property-guided molecule generation with geometry-complete flow matching. Nat Comput Sci. 2026. doi: 10.1038/s43588-025-00946-y
【全文结束】

