来自斯坦福大学、基因泰克和陈-扎克伯格倡议的一组科学家声称,科学界有“前所未有的机会”利用人工智能(AI)创造历史上第一个虚拟人体细胞。他们指出,最近在AI领域的进展以及关于人类生物学的大量实验数据已经达到了临界点。这样的细胞可以精确地表示和复制人类大分子、细胞乃至最终组织和器官的确切行为。
“建模人体细胞可以被认为是生物学的圣杯。AI提供了直接从数据中学习的能力,使我们能够超越假设和直觉,发现复杂生物系统的突现性质。”该研究的资深作者、斯坦福大学副教授艾玛·伦德伯格(Emma Lundberg)说道。
伦德伯格的资深合著者包括两位斯坦福大学同事:生物工程学教授兼陈-扎克伯格倡议科学主管斯蒂芬·奎克(Stephen Quake),计算机科学教授兼工程学院教授尤雷·莱斯科维奇(Jure Leskovec),以及陈-扎克伯格倡议科学人工智能负责人提奥凡尼斯·卡拉莱托索斯(Theofanis Karaletsos)和基因泰克研究执行副总裁阿维夫·雷格夫(Aviv Regev)。
巨大的前景
这样一个合成细胞模型将更好地理解维持健康人体细胞功能的化学、电气、机械和其他力和过程之间的复杂相互作用,以及导致细胞功能障碍或死亡的疾病的潜在原因。
更有趣的是,AI虚拟细胞将允许科学家进行计算机模拟实验而不是活体实验,即在计算机上而不是在活细胞或生物体上进行实验。这一技能将扩大人类对生物学的理解,加速新疗法、药物的搜索,甚至可能找到疾病的治疗方法。
癌症研究人员可能会创建模型,展示特定突变如何使健康细胞变成恶性细胞。
微生物学家有一天或许能够预测病毒如何影响感染的细胞及其可能的宿主生物体。医生们或许有一天可以在患者的“数字孪生”上测试治疗方案,开启一个更快、更便宜、更安全的个性化医疗时代。
作者认为,要被视为成功的AI虚拟细胞必须实现三个目标。首先,它需要为研究人员提供跨物种和细胞生成通用表示的能力。其次,它需要能够可靠地预测细胞功能、行为和动态,并理解细胞机制。最后,AI虚拟细胞将使计算机实验能够测试想法并推动数据收集,以比今天更快、更低的成本提高虚拟细胞的能力。
全球合作
作者称其为研究的“三重奏”,AI已经开启了预测、生成和可查询工具的时代,但生成虚拟细胞所需的大量原始生物数据不容忽视。
相比之下,作者提到了由美国国立卫生研究院生产的DNA测序数据存储库——短读序列档案(Short Read Archive),该档案已拥有超过14拍字节的数据,比用于训练ChatGPT的数据集大一千倍。
创建AI虚拟细胞并非易事。它需要在蛋白质组学、遗传学、医学成像等领域的前所未有的全球开放科学合作,以及学术界、工业界和非营利组织的全球利益相关者的密切合作。
同时,作者强调,任何关于AI虚拟细胞的工作都应以理解为基础,即所产生的模型将免费提供给整个科学界。
伦德伯格总结道,“这是一个庞大的项目,类似于基因组项目,需要跨学科、行业和国家的合作,我们明白完全功能的模型可能需要十年或更长时间才能问世。但是,随着当今迅速扩展的AI能力和我们庞大的且不断增长的数据集,现在是科学界团结起来,开始革命性地改变我们理解和建模生物学的方式的时候了。”
来源:
斯坦福大学
期刊参考:
Bunne, C., et al. (2024) 如何用人工智能构建虚拟细胞:优先事项和机遇。《细胞》。doi.org/10.1016/j.cell.2024.11.015.
(全文结束)


