Ginkgo Bioworks已通过Ginkgo Datapoints宣布启动虚拟细胞药理学计划(Virtual Cell Pharmacology Initiative,简称VCPI)。这一开源平台旨在通过汇集研究人员、制药公司和AI开发者,建立社区驱动的合作机制,为药物发现中的虚拟细胞建模构建标准化框架,创建同类中最大的公共数据集,目标是测试至少100,000种化合物并生成超过120亿个数据点。
尽管虚拟细胞模型已作为药物发现中潜在的宝贵工具出现,但缺乏标准化、可靠的湿实验方法和适当的药理数据使得这些模型无法可靠地预测药物将如何影响细胞。除VCPI外,Arc研究所今年早些时候也宣布了首届虚拟细胞挑战赛,以解决这一差距。
Ginkgo Datapoints总经理John Androsavich博士表示:"要开发一种药物,你需要对类药物分子进行测量。VCPI专注于生成正是这样的数据:高质量的药理数据,基于整个研究社区可以构建的标准化细胞系。我们不仅仅是生成数据,我们正在创建该领域应如何发展的标准。"
与其他发布已完成数据集的虚拟细胞计划不同,VCPI将允许贡献者在数据创建前参与,通过Ginkgo Datapoints提供免费的高通量RNA分析。
Androsavich表示,AI和生物学社区在什么构成良好训练数据方面并不总是一致。"当前的方法依赖于大量低质量数据。这就像空热量——大量数据,但嘈杂且可能不可重复。我们相信VCPI将证明质量和数量可以共存。我们同时提供这两者,并采用专为药物开发者最关心的药理应用设计的方法。"
VCPI解决了开发预测性虚拟细胞模型的两大挑战。第一个挑战是虚拟细胞中缺乏定义明确的"细胞"。作为解决方案,Ginkgo Datapoints提出了V-Ref293,这是一种专门指定为虚拟细胞研究参考标准的新型工程细胞系。主细胞库小瓶将于2026年向社区提供,确保全球实验室能够生成可比较的结果。
其次,可扩展的湿实验方法缺乏高信噪比。Ginkgo Datapoints提出了DRUG-seq,这是一种经过制药行业验证的高通量RNA批量测序方法,作为比单细胞方法更适合药物筛选的替代数据。
该计划欢迎开放参与,研究人员和公司可以免费贡献化合物进行测试,数据将根据知识共享许可协议(CC BY 4.0)定期发布到公共领域。参与者可以选择在公共发布前保留一段时间的独家数据访问权,或无限期保留数据供自己使用。
为鼓励参与,贡献者可以对优先级进行投票,分享模型,参与未来的竞赛,并参与社区讨论论坛。活跃贡献者可以获得"超级用户"身份并获得早期数据访问权限。
【全文结束】


