机器学习工程师定制Cas9酶用于基因编辑Machine Learning Engineers Bespoke Cas9 Enzymes for Gene Editing

环球医讯 / AI与医疗健康来源:www.genengnews.com美国 - 英语2025-04-23 11:00:00 - 阅读时长3分钟 - 1378字
麻省总医院和哈佛医学院的研究人员开发了一种机器学习模型,能够预测适用于特定目标的定制Cas9蛋白,并可用于研究或治疗用途。这种可扩展的方法可以设计和表征数百或数千种新型Cas9蛋白的生化特性。
基因编辑Cas9酶机器学习遗传疾病视网膜色素变性视力丧失脱靶效应碱基编辑器基因编辑技术网络工具
机器学习工程师定制Cas9酶用于基因编辑

在《自然》杂志上发表的一项新研究中,麻省总医院(MGH)和哈佛医学院(HMS)的研究人员开发了一种机器学习模型,该模型能够预测更适合特定目标的定制Cas9蛋白,并且可以根据需要设计具有特定特性的Cas9蛋白,以用于研究或治疗用途。研究人员表示,这种可扩展的方法可以设计和表征数百或数千种新型Cas9蛋白的生化特性。

“我们很高兴与基因组编辑社区分享这些酶,并希望获得关于它们作为核酸酶、碱基编辑器和其他基因组编辑工具的表现反馈,”HMS病理学副教授Benjamin Kleinstiver博士在接受《GEN》采访时说道。

为了安全而精确地纠正导致遗传疾病的突变,基因组编辑技术必须被编程为针对患者特定的序列,同时限制脱靶效应。Cas核酸酶通过识别原间隔区相邻基序(PAM)来识别基因组目标,这会引发引导RNA与目标位点的配对。对于常用的化脓性链球菌Cas9(SpCas9),配对需要标准的PAM序列3'NGG,这不可避免地限制了该酶只能用于编码PAM的基因组序列。

为了扩大基因组的可访问性,一种常见的工程策略是放宽PAM的要求,以便能够在新的位点进行编辑,同时保持对NGG的活性,从而创建适用于广泛应用的通用酶。然而,对于放宽PAM要求的酶,在实现高效在靶编辑的同时最小化脱靶效应仍然是一个挑战。

在这项新研究中,Kleinstiver的团队生成了数百种工程化SpCas9酶的实验PAM谱型,以训练一个将氨基酸序列与PAM特异性关联起来的神经网络。由此产生的PAM机器学习算法(PAMmla)预测了约6400万种SpCas9酶的PAM。然后,它确定了有效且特异的酶,这些酶在人类细胞中的核酸酶和碱基编辑器表现优于现有的进化和工程候选酶,同时减少了脱靶效应。

在用户指导的Cas9酶设计示例中,MGH小组在人类细胞和小鼠中进行了对视紫红质P23H突变的选择性靶向。这种突变是常染色体显性视网膜色素变性(adRP)的常见原因,这是一种导致视力丧失的遗传性眼病。

“我们设想,这种可扩展的工程、深度表征以及利用机器学习预测更大范围蛋白质的一般框架可以扩展到许多令人兴奋的领域,包括Cas9酶的其他特性,如目标位点特异性和在靶活性,以及其他非CRISPR酶,”该研究的第一作者、HMS研究生Rachel Silverstein在接受《GEN》采访时说道。

其他应用包括将这种工程工作流程扩展到下一代编辑器中的其他蛋白质结构域,例如用于碱基编辑器的脱氨酶结构域、用于素编辑器的逆转录酶结构域以及用于点击编辑器的DNA聚合酶。

机器学习相比传统的实验工程策略具有关键优势,后者通常难以预测多个同时突变的功能影响,并且面临繁琐且耗时的实验选择策略。作者表示,计算预测可以筛选出更多携带多样化氨基酸替换组合的酶,从而增加在更深层次突变空间中识别最佳酶的概率。

据Silverstein介绍,这种方法的关键在于建立一个简单且可扩展的生化测定方法,能够并行提供数千种酶的丰富数据,为训练机器学习模型提供必要的数据。

“从长远来看,我们设想机器学习可以广泛应用于增强基因编辑技术的活动,这将有利于创建一个多样且完整的工具箱技术,”Silverstein告诉《GEN》。

作者已经将PAMmla作为一个网络工具提供,以加速SpCas9酶的定制,供研究或转化使用。


(全文结束)

大健康
大健康