谷歌(Google)旗下的DeepMind推出了名为AlphaGenome的全新人工智能工具,旨在预测人类DNA中的遗传变异如何影响调控基因的生物过程。这款AI模型能够分析多达100万个DNA碱基对,并预测数千种与调控活动相关的分子特性。它还可以通过比较突变和未突变序列的预测结果来评估遗传变异的影响。
DeepMind目前正通过API以预览形式向非商业研究领域开放AlphaGenome,并计划在未来发布完整模型。这一新工具基于DeepMind此前的基因组学模型Enformer开发而成,同时补充了专注于蛋白质编码区域(占基因组仅2%)的AlphaMissense。AlphaGenome的目标是解读剩余98%的非编码区域,这些区域负责协调基因活动并包含许多与疾病相关的变异。
据DeepMind介绍,AlphaGenome相较于现有的DNA序列模型具有多项优势,包括高分辨率的长序列分析、跨多个生物过程的全面预测、高效的变异评分以及新颖的剪接位点建模。公司表示,在针对单个DNA序列生成预测的24项评估中,AlphaGenome在22项上优于最佳外部模型;而在预测变异的调控效应时,它在26项评估中的24项上达到或超过了顶级外部模型的表现。
伦敦大学学院的马克·曼苏尔教授(Professor Marc Mansour)表示:“确定不同非编码变异的相关性可能非常具有挑战性,尤其是在大规模的情况下。AlphaGenome将成为一个强大的工具,帮助我们更好地连接相关数据,从而理解癌症等疾病。” 纪念斯隆-凯特琳癌症中心(Memorial Sloan Kettering Cancer Center)的克莱布·拉罗博士(Dr. Caleb Lareau)称其为“该领域的里程碑”,并指出:“这是首次有单一模型能够统一长距离上下文、碱基级精度,并在广泛的基因组任务中实现最先进的性能。”
DeepMind认为,AlphaGenome可能会推动疾病理解、合成生物学以及基础基因组研究的发展。该公司通过使用该工具研究T细胞急性淋巴细胞白血病(T-cell acute lymphoblastic leukemia)相关的癌症突变,成功复制了一种已知的疾病机制,展示了其潜力。
尽管功能强大,DeepMind也承认AlphaGenome存在一些局限性,例如难以捕捉非常远距离调控元件的影响以及提高细胞特异性模式识别的难度。公司强调,AlphaGenome仅用于研究目的,尚未经过临床应用验证。
(全文结束)


