ChromoGen:可在几分钟内预测3D基因组结构的人工智能工具ChromoGen: the AI tool predicting 3D genomic structures in minutes

环球医讯 / AI与医疗健康来源:www.biotechniques.com美国 - 英语2025-02-07 23:00:00 - 阅读时长3分钟 - 1021字
来自麻省理工学院的研究团队开发了一种名为ChromoGen的新AI工具,能够在几分钟内准确预测3D基因组结构,大大缩短了原本需要数天的实验时间,有助于深入研究基因表达模式及其在健康和疾病中的作用。
ChromoGen人工智能工具3D基因组结构染色质结构基因表达健康与疾病深度学习模型生成式AI模型DNA突变疾病状态
ChromoGen:可在几分钟内预测3D基因组结构的人工智能工具

一种新型、免费可用的人工智能工具将确定染色质结构的时间从几天缩短到了几分钟。麻省理工学院(美国马萨诸塞州)的张斌领导的研究团队开发了一种AI模型,可以在几分钟而不是几天内准确预测3D基因组结构。该工具可用于探索基因组结构如何影响健康和疾病中的基因表达。

在细胞核内,DNA和蛋白质形成一个复杂的结构,称为染色质。长长的DNA链缠绕在蛋白质上,将2米长的DNA压缩到直径仅为百分之一毫米的细胞核中。表观遗传修饰影响染色质的折叠,这影响基因的可及性并在调控基因表达中起着关键作用。科学家们已经开发了如Hi-C等实验技术来确定染色质结构;然而,这些技术非常耗时,生成一个细胞的数据可能需要一周时间。

为了创建更快速的技术,研究人员转向了人工智能。他们开发了一个名为ChromoGen的模型,该模型由两个组件组成。第一个组件是一个深度学习模型,它读取基因组,分析DNA序列和染色质可及性数据。第二个组件是一个生成式AI模型,经过超过1100万个染色质构象的训练,使其能够预测物理上准确的染色质构象。

当这两个组件结合时,深度学习模型会告知生成式模型特定细胞类型的环境如何影响各种染色质结构的形成。这种方法有效地捕捉了序列和结构之间的关系。由于DNA是一种高度无序的分子,单个DNA序列可以产生许多不同的可能构象,因此该模型为每个序列生成多种潜在结构。

“预测基因组结构的一个主要复杂因素是我们并不是在寻找单一的解决方案。无论你观察基因组的哪一部分,都存在一系列结构。预测这种非常复杂、高维的统计分布是非常具有挑战性的,”第一作者Greg Schuette解释道。

一旦训练完成,ChromoGen可以在比Hi-C等实验技术快得多的时间尺度上生成预测。“你可能会花费六个月的时间进行实验,以获得几十个特定细胞类型的结构,而我们的模型可以在20分钟内在单个GPU(图形处理单元)上生成一千个特定区域的结构,”Schuette评论道。

研究人员使用该模型为2000多个DNA序列生成了结构预测,并将其与实验确定的结构进行了比较,发现预测结构与实验确定的结构相同或非常相似。

该模型可以为其他细胞类型做出准确的染色质结构预测,而不仅仅是其训练所用的细胞类型,表明它可以用于探索不同细胞类型之间染色质结构的差异以及这些差异如何影响功能。该模型还可以用于研究DNA突变如何影响染色质结构,以及这是否会引发疾病状态。

该模型可在GitHub上获取。


(全文结束)

大健康
大健康