Image2Reg:通过细胞图像识别基因调控的新方法AI can identify genetic perturbations from cell images, offering new path for drug discovery

环球医讯 / AI与医疗健康来源:www.msn.com瑞士 - 英语2025-05-14 01:00:00 - 阅读时长5分钟 - 2100字
保罗谢勒研究所(Paul Scherrer Institute PSI)的研究人员开发了一种名为Image2Reg的人工智能系统,该系统能够通过简单的细胞核显微图像识别基因扰动模式,从而可能为新药物的开发提供一种新的、成本效益更高的方法。
健康新药物开发癌症阿尔茨海默病神经退行性疾病慢性炎症自身免疫性疾病纤维化Image2Reg基因调控
Image2Reg:通过细胞图像识别基因调控的新方法

保罗谢勒研究所(Paul Scherrer Institute PSI)的研究人员开发了一种人工智能系统,这种系统可能为识别细胞图像中的基因扰动模式开辟一条新的、成本效益更高的途径——这可能会促进新药物的开发。

这项工作的详细论文发表在《细胞系统》(Cell Systems)期刊上。

现代医学的治疗策略集中在早期检测和针对性地操纵与疾病相关的基因。特别是对于癌症、阿尔茨海默病等神经退行性疾病以及与衰老相关的慢性炎症等复杂疾病,挑战不仅在于识别单个基因,还在于理解它们的调控网络。越来越明显的是,细胞核中DNA的三维组织结构——即染色质——起着关键作用。

到目前为止,分析这些基因变化依赖于复杂的、昂贵的基因表达或测序技术。在这篇论文中,由PSI生命科学中心多尺度生物成像实验室主任G.V. Shivashankar(也是苏黎世联邦理工学院机械基因组学教授)和Broad研究所Eric和Wendy Schmidt中心主任Caroline Uhler(同时也是麻省理工学院电气工程和计算机科学教授)领导的研究人员提出了一种新方法。

他们与学生同事Daniel Paysan、Adityanarayanan Radhakrishnan和Xinyi Zhang共同开发了一种名为Image2Reg的人工智能系统。该系统可能仅基于细胞核的简单显微图像(例如使用蓝色荧光染料Hoechst染色后获得的图像)来识别基因扰动和潜在的药物靶点。

“结合成像、机器学习和分子网络最终可能实现快速且成本效益高的诊断和治疗访问。”Shivashankar解释道。

在Image2Reg(意为从细胞图像到基因调控)的第一步中,研究人员利用了这样一个事实:当特定基因的活性被破坏或实验性过度刺激时,细胞核的三维结构——包装DNA的染色质——会明显改变。由此产生的图像通常显示染色质外观的非常微妙但系统的改变。

然后,研究人员训练了一个自适应算法——卷积神经网络(CNN),这是一种专门处理图像的人工智能——来识别这些模式。AI发展出了一种“眼睛”,能够识别染色质图像中典型活动留下的痕迹。

在进行图像分析的同时,Image2Reg构建了一个特定于所研究细胞类型的生物网络,描述了细胞内基因之间的关系。这个网络基于两个已确立的分子生物学原则:首先,基于已知的蛋白质-蛋白质相互作用——换句话说,哪些蛋白质相互接触并触发生化过程。

其次,它包括基因表达数据——既来自单细胞分析,也来自经典的整体测量,在这些测量中记录了大量细胞的平均活性。这些数据显示哪些基因同时活跃,并可能影响或调节彼此。

最后,这些信息以数学模型的形式进行总结。该模型处理基因之间的复杂联系,并为每个单独的基因创建一个数值表示,反映其功能、角色及其在生物系统中的连接性。目标是为细胞创建一种“规则书”,描述哪些基因协同工作、相互调节或分配到某些信号通路——无论它们在细胞图像中如何表现。

在最后的决定性步骤中,Image2Reg将之前获得的两种理解——基于图像的细胞核可视化和基因网络的分子知识——结合起来。这是通过一种称为核机的方法完成的,更具体地说是神经切线核(NTK)。该模型学习如何将从图像分析中推导出的数值模式——即神经网络从细胞图像中推断出的内容——与生物网络中基因的功能关系相匹配。

正确预测远高于随机水平

研究人员有近一百万张单细胞图像用于训练AI——一些来自未经处理的对照细胞,另一些来自故意过激活单个基因的细胞。

在随后的测试中,要求模型仅根据细胞图像识别41个可能基因中的哪一个发生了改变。AI的准确率为26%。也就是说,在四分之一的细胞中,它正确确定了哪个基因被修改。相比之下,基于偶然性的成功率约为2%。研究人员认为,这清楚地表明,细胞结构中存在可识别的模式,这些模式与某些基因相关,并且可以通过图像分析来识别。

“它在形式和功能之间、图像和生物学之间建立了一座桥梁。”Uhler解释道。

诊断和治疗的工具

Image2Reg过程仍处于起步阶段。然而,它为具有重大医学意义的实际应用打开了大门。许多疾病——如癌症、阿尔茨海默病或自身免疫性疾病——都源于基因调控的紊乱。作者设想,Image2Reg可以用来识别哪些基因受到疾病或治疗的影响——而无需进行复杂的实验分析。

最终,希望这一过程能够在疾病的早期阶段识别疾病,远早于经典的标记物如蛋白质、RNA或已知症状可以测量的时候。

在一个新成立的初创公司中,研究人员希望利用他们的发现来开发一种治疗纤维化的疗法,目前这种疾病尚无治愈方法。在这种临床状况下,身体用坚硬的疤痕样组织替代功能性组织。长期来看,这会降低器官功能。肺、肝和心脏经常受到影响。

Image2Reg的工作原理

  • 分析细胞图像:AI使用卷积神经网络(CNN)识别染色质结构中的细微变化。
  • 构建网络:同时,基于已知的蛋白质相互作用和基因表达数据,构建一个特定于细胞类型的网络。每个基因都被赋予一个在其细胞框架内的功能的数学表示。
  • 整合两个层面:神经切线核(NTK)将图像和网络数据合并,使基因活性可见。


(全文结束)

大健康
大健康