斯科尔科沃科学技术研究院(Skoltech)的研究人员利用生成式人工智能来填补DNA中基因对之间距离的缺失数据。这使得研究人员能够确定DNA分子的三维结构,这对于开发遗传疾病治疗方法和诊断方法至关重要。
这项研究发表在《科学报告》期刊上,是首次成功使用AI或其他方法填补此类数据的尝试。
在此之前,科学家们只能依赖不完整的数据,这阻碍了医学遗传学的进步,并限制了科学家对染色质生物物理学的理解。
为了正常工作,DNA不仅需要正确的基因组合,还需要正确的三维结构,这通常是统计物理学,特别是聚合物物理学的研究对象。
细胞中的46条长DNA大分子在空间中的折叠方式会影响哪些基因处于活跃状态,以及细胞是否能够适当地繁殖并在胚胎发育过程中分化为特定类型的细胞。相反,错误的DNA结构在异常和疾病的发展中起着作用,例如癌症。
科学家们越了解稳定“健康”DNA三维结构背后的物理原理,就越能创造诊断和治疗遗传疾病的机会。
通过比较健康和疾病状态下的DNA空间结构,可以找到诊断疾病和个性化治疗的生物标志物。科学家们可以识别新的治疗靶点,开发恢复正常基因功能的药物,并设计精确的基因编辑干预措施。
目前最常用的实验技术之一是荧光显微镜,用于检查DNA分子在空间中的折叠方式。这种光学显微镜技术通过用荧光标签标记特定的基因序列来突出这些序列。
问题在于,这样的数据总是片段化的。为了附上荧光标签,科学家们合成了一段与DNA链上感兴趣位置的序列互补的短基因序列。
然而,并不是所有序列都可以这样做。如果序列包含重复的核苷酸,例如一串A字母,那么该序列就无法被选择性地染色,因为它不是唯一的。因此,研究人员不得不依赖不完整的数据。但现在情况不同了。
“一旦你知道了足够多的基因之间的距离,确定没有实验数据的其余距离就变成了一个具有特定解的数学问题。”该研究的主要研究员、斯科尔科沃神经科学助理教授Kirill Polovnikov评论道。
“我们首次展示了生成模型能够解决这类问题。这是一种通常用于更‘创造性’任务的AI,例如根据用户提示生成图像和文本。同时,这也是对染色质结构研究的一种新方法,在这个领域,聚合物物理学一直占据主导地位。”
这项研究的影响是双重的。从实际应用的角度来看,斯科尔科沃团队提出并测试了一种处理荧光显微镜数据的方法,最终将使人们更好地理解DNA的空间结构,从而有望改善遗传疾病的治疗和诊断。从根本上说,该研究表明生成式人工智能在传统应用范围之外的潜力。
(全文结束)


