斯坦福大学的研究人员正在利用机器学习来提高细胞和基因疗法的有效性和安全性。大多数人类疾病都是由于体内蛋白质的功能失调引起的,因此引入一种新的治疗性蛋白质来治愈功能失调的蛋白质是一个理想的方法。
尽管几乎所有的治疗性抗体都是完全人类的或经过工程改造以看起来像人类的,但类似的方法尚未应用于其他治疗性蛋白质,尤其是那些在细胞内操作的蛋白质,如CAR-T和CRISPR技术中的蛋白质。后者仍然存在引发免疫反应的风险。为了解决这个问题,Gao实验室的研究人员转向了机器学习模型。
在这篇论文中,我们提出了一个问题:为什么不从一开始就设计避免免疫反应的治疗方法呢?随着计算工具的进步,我们现在正试图预测哪些蛋白质变化可能触发免疫反应,并只推进那些不太可能被身体排斥的设计。”该论文的资深作者、斯坦福大学工程学院化学工程助理教授Xiaojing Gao说。
通过结合三个独立的机器学习算法,研究团队已经取得了显著进展,开发出了一种高效设计蛋白质的工具,这些蛋白质在引入人体后既能避免免疫反应问题,又能保持其功能性。
设计锌指蛋白
减少这些治疗药物免疫反应的一种方法是从人体中已存在的蛋白质开始。因此,Gao团队选择了称为锌指的小型蛋白质,它们是真核生物中最丰富的蛋白质之一,负责调节基因表达。
由于它们能够自然地与人类DNA结合,因此它们是现有技术(如来自细菌的CRISPR)的良好替代品,后者更有可能触发免疫反应。
“我们工作的最重要部分是我们取得了在设计锌指DNA结合域方面的进展,这些结合域能够针对我们选择的任何基因组位点,同时保持较低的免疫反应风险预测。”化学工程博士生Eric Wolsberg说,他是这篇论文的主要作者。
天然存在的锌指蛋白会与人类基因组中的特定序列结合,这是进化过程的结果。然而,为了将它们重新用于细胞或基因治疗,团队使用第一个算法预测了新的DNA靶标,例如致病基因,这些靶标可以与锌指组合结合。
由于锌指通常被链接在一起以识别更长的DNA片段,团队将它们组装成阵列,创建了新的单个锌指单元之间的连接。
但有一个复杂的问题。
“这些连接是不自然的,它们不会出现在我们的体内。”Gao说。“这意味着免疫系统可能会将它们识别为外来物并作出反应。”
然后,团队利用了第二个机器学习算法MARIA,该算法由论文的共同作者、前斯坦福大学研究生Binbin Chen和医学院肿瘤学Moghadam家族教授Ash Alizadeh开发。MARIA旨在预测这些锌指蛋白连接的免疫原性,以设计癌症疫苗。
优选的是疫苗高度免疫原性,这意味着团队反向使用MARIA来筛选避免免疫检测的连接或突变。如果MARIA预测工程化的锌指不太可能被免疫系统识别,那么该设计就被认为是更安全的。
虽然这两种模型的结合确实产生了功能性的锌指阵列,但它们显示出有限的效能,这可能是由于用于预测锌指结合序列的算法的局限性。
为了保持降低的免疫原性并进一步提高工程化锌指的功能,团队应用了他们的第三个算法:一个强大的蛋白质语言模型ESM-IF1。
借鉴其从数百万天然蛋白质序列中训练得到的经验,ESM-IF1像一位经验丰富的编辑一样,建议进行高成功率的单字母遗传调整,以提高锌指的性能。
“过去,研究人员尝试随机突变来改进锌指,但这既慢又低效——而且它们也不兼容MARIA过滤。”Gao说。“有了这个语言模型,我们可以专注于智能、有针对性的变化。”
在使用ESM-IF1建议潜在突变后,团队再次通过MARIA运行修改后的序列,以确保这些变化不会引入新的免疫原性特性。
“我们只推进通过了两个测试——高功能性和低免疫原性的突变。”Gao说。
团队通过计算机预测和实验室测试比较了原始锌指蛋白与AI建议突变版本的性能,以确认其性能提升。原始蛋白使人类基因的产生增加了两到四倍,而AI增强版本在实验室测试中进一步增加了两到六倍。
“我们将锌指工程推向了一个前所未有的地方,同时保持了功能并降低了免疫原性。”Gao说。
研究人员计划在此方法的基础上继续努力,目标是开发一个端到端的算法,有朝一日可以帮助设计用于人类的锌指基因疗法。
(全文结束)


