总部位于加州帕洛阿尔托的初创公司Tahoe Therapeutics(现估值1.2亿美元)开发出可扩展的快速生成关键生物学数据技术,用于人工智能模型构建——这项突破正助力发现癌症新疗法。
生物学的"圣杯"
数字化模拟活细胞是生物学研究的终极目标之一。若研究人员能通过计算机精准预测药物在人体内的反应,将显著提升动物和人体试验的成功率。尽管大语言模型在蛋白质行为建模方面取得突破,但将同类技术应用于整细胞复杂系统的模拟仍面临数据量不足的瓶颈。
技术突破与数据革命
今年2月,Tahoe Therapeutics发布里程碑成果——Tahoe-100M数据集。该数据集包含1亿个不同癌细胞对1000余种分子反应的扰动数据点,这类扰动数据对训练AI模型至关重要,因其能提升算法预测细胞分子响应的能力。"我们认为Tahoe-100M是单细胞数据集的'火星登陆'时刻,"39岁的CEO尼玛·阿利杜斯特(Nima Alidoust)向《福布斯》表示。
Mosaic平台优势
该数据集的快速构建得益于公司独创的Mosaic平台。首席科学官兼联合创始人约翰尼·于(Johnny Yu)解释说:"传统技术每次只能测试单个患者的细胞,而Mosaic能将来自不同患者、不同器官的细胞整合实验,在每次测试中生成海量单细胞药物响应图谱。"
融资与产业合作
今日公司宣布完成3000万美元B轮融资,由Amplify Partners领投,Databricks Ventures、Wing Venture Capital等跟投,公司估值达1.2亿美元。AIX Ventures合伙人克里希·拉马杜莱(Krish Ramadurai)指出:"Tahoe生成的高质量数据显著提升了AI模型预测准确率——这些曾让生物技术公司饱受挫折的'实验室幻觉'问题正在被解决。"
行业应用前景
在Tahoe发布数据集数月后,Arc研究所即利用Tahoe-100M开发出开源虚拟细胞模型State。基准测试显示其准确率是传统AI模型的两倍,并超越基础机器学习程序。该成果验证了联合创始人于博士(UCSF生物化学教授哈尼·古达齐实验室)近十年技术积累的价值。
战略布局与未来目标
目前公司正构建包含超10亿单细胞数据点的下一代数据库,同时推进首个针对重大癌症亚型的候选药物研发,已进入FDA临床试验前阶段。阿利杜斯特透露:"我们计划与大型药企或AI公司共享部分数据,通过协作开发新药物和新型AI模型。"
"我们常说生物学的黎明已经到来,"阿利杜斯特总结道:"我们正在搭建基础,期待更多伙伴加入这场细胞数字革命。"
【全文结束】


