德克萨斯大学奥斯汀分校和赛诺菲之间学术与工业合作开发的一种新的人工智能模型可以改进药物和疫苗的发现过程,通过预测特定mRNA序列产生蛋白质的效率,无论是总体还是在各种细胞类型中。这一新进展有助于预测细胞将产生多少蛋白质,从而减少试错实验的需求,加速下一代mRNA治疗的发展。
信使RNA(mRNA)包含制造哪些蛋白质以及如何制造的指令,使我们的身体能够生长并执行日常的生命过程。在健康和医学最有前景的领域之一,开发新的mRNA疫苗和药物——能够对抗病毒、癌症和遗传疾病——涉及一个经常具有挑战性的过程,即诱导患者体内细胞从治疗性mRNA中产生足够的蛋白质,以有效对抗疾病。
这个名为RiboNN的新模型,通过揭示什么将产生最高量的蛋白质或更好地靶向身体特定部位如心脏或肝脏,指导新的基于mRNA的治疗的设计。研究团队今天在《自然生物技术》杂志上发表了两篇相关论文中的其中一篇。
德克萨斯大学奥斯汀分校分子生物科学副教授Can Cenik说:“当我们六年前启动这个项目时,还没有明显应用。”他与赛诺菲mRNA卓越中心的mRNA平台设计数据科学主管Vikram Agarwal共同领导了这项工作。“我们好奇细胞是否会协调它们产生哪些mRNA以及它们被翻译成蛋白质的效率如何。这就是好奇心驱动研究的价值。它为像RiboNN这样的进步奠定了基础,而这直到很久以后才成为可能。”
这项工作得到了美国国立卫生研究院、Welch基金会以及德克萨斯大学奥斯汀分校高级计算中心的Lonestar6超级计算机的资金支持。
在跨越140多种人类和小鼠细胞类型的测试中,RiboNN在预测翻译效率方面比早期方法准确约两倍。这一进步可能赋予研究人员以新的能力,在细胞中进行预测,从而帮助加速癌症和传染性及遗传疾病治疗的发展。
你可以将你体内细胞制造蛋白质的方式想象成一组厨师烤蛋糕的方式。为了制作一批蛋白质,你细胞中的厨师(核糖体)会在你独特的蛋白质食谱书(即DNA)中查找食谱,将食谱复制到称为信使RNA(mRNAs)的便签卡上,然后根据食谱组合原料(氨基酸)来制作蛋糕(蛋白质)。
一种mRNA疫苗或治疗剂会诱导你细胞中的这些厨师制造蛋白质。在疫苗的情况下,它们可能会产生一种存在于致病病毒或癌细胞表面的蛋白质,基本上是在你的免疫系统面前挥舞一面大红旗,使其产生对抗病毒或癌症的抗体。在由遗传突变引起的疾病情况下,它们可能会产生一种你的身体无法自行正确制造的蛋白质,从而逆转疾病。
在开发他们的新预测模型之前,Cenik和德克萨斯大学团队首先整理了一个包含10,000多个实验的公开数据集,测量了在不同的人类和小鼠细胞类型中,不同mRNA转化为蛋白质的效率。一旦他们创建了这个训练数据集,德克萨斯大学和赛诺菲的AI和机器学习专家就联合开发了RiboNN。
Cenik表示,预测工具的一个目标是有一天能够制造针对特定细胞类型的疗法,他同时也是德克萨斯大学奥登计算工程与科学研究所的附属教员,并获得了德克萨斯癌症预防研究所(CPRIT)的学者研究支持。
他说:“也许你需要下一代疗法在肝脏、肺部或免疫细胞中制造。”“这为改变mRNA序列以增加该细胞类型中该蛋白质的生产打开了机会。”
在另一篇同样发表在《自然生物技术》上的配套论文中,研究团队证明具有相关生物功能的mRNA在不同细胞类型中转化为蛋白质的水平相似。科学家们早已知道,将具有相关功能的基因转录为mRNA的过程是协调的,但此前并未显示mRNA转化为蛋白质的过程也是协调的。
德克萨斯大学的本科生研究人员手动检查了可用数据的准确性,并填补了缺失的信息,以创建用于训练AI模型的数据集RiboBase。参与开发RiboNN的团队包括德克萨斯大学计算机科学研究生Logan Persyn,以及赛诺菲的Dinghai Zheng和Jun Wang。德克萨斯大学“从发现到影响”办公室通过制定研究协议,协助促成了德克萨斯大学与赛诺菲之间的合作。
【全文结束】


