DNA是为所有生物提供生存指令的遗传密码,但并非所有的DNA片段都对物种的生存有帮助。一些DNA片段更像是寄生虫,搭便车并为了自己的生存而存在。
为了将DNA转化为蛋白质,这些自私的DNA元素必须从遗传代码中移除。这样做使身体能够产生构成生命的各种蛋白质,但这个过程也可能导致健康问题,如某些类型的癌症。
加州大学圣克鲁兹分校的研究人员正在研究这些遗传元素隐藏和复制自身的方式,以便它们可以在一个物种的DNA中传播,甚至通过一种称为“水平基因转移”的过程跳到另一个无关物种中。
一项发表在《美国国家科学院院刊》上的新研究表明,一种名为“内含子”的遗传元素是许多这些自私基因在物种内部和物种之间传播的原因。该研究提供了八个内含子在无关物种之间转移的例子,这是首次证明这种现象存在的实例。
这些结果有助于我们理解基因组是如何变得如此复杂的,以及我们如何利用这种复杂性进行人类健康研究。
“内含子是一种基因组结构和复杂性出现的方式,但这并不一定是因为自然选择青睐这种复杂性。少数可能最终对宿主有益,但大多数只是找到了一种很好的方式隐藏在基因组中的作弊者。”
该研究的资深作者、比斯金工程学院生物分子工程教授Russ Corbett-Detig说。
研究内含子
Corbett-Detig和他的前本科生Landen Gozashti(现在是加州大学伯克利分校的博士后研究员)多年来一直在研究内含子,这些非编码DNA片段在蛋白质生成之前必须被移除。
他们想弄清楚为什么这些非蛋白质编码的DNA片段在所有动物、植物、真菌和原生生物中以不同的数量存在,以及它们是如何成功复制自己并生存下来的。长期以来,关于这些内含子是如何首先出现在DNA中的一直是一个谜,因为大多数内含子似乎没有进化功能。
科学家们对此感兴趣,不仅是为了进一步了解基因组进化,还因为内含子允许一个关键的过程称为“可变剪接”。内含子必须从DNA序列中剪切出来才能生成蛋白质,但这个过程可以有变异和错误,这意味着可以从同一个基因生成不同版本的蛋白质。最终,这使得一个生物体可以更复杂,但也引入了如果剪接破坏基因则可能导致健康问题的风险。包括加州大学圣克鲁兹分校基因组学研究所的许多研究人员都在研究如何通过研究可变剪接来更好地理解遗传疾病。这项研究增强了这一健康相关工作的基础科学。
在这项研究中,研究人员证明了内含子是新内含子出现在物种DNA中的主要方式之一。内含子是一种转座元件,即“跳跃基因”,它可以从前一个基因组的一部分移动到另一部分,并找到了一种成功地在整个基因组中复制内含子的方法。团队过去的工作已经暗示了这一点,但他们先进的搜索多种物种DNA的方法现在使他们能够明确地确认他们的假设。
研究人员在数千种物种的DNA中搜索内含子,这只有在最近协调努力对广泛的生物多样性进行测序并将数据公开可用的情况下才成为可能,例如地球生物基因组计划和桑格生命树项目。
他们在分析的8,716个基因组中发现了1,093个内含子家族,表明有许多种类的内含子能够通过各种物种的基因组传播内含子。
“由于转座子非常多样化并且几乎存在于每一种真核生物中,这表明这确实可以是一种非常普遍的新内含子在不同谱系中出现的方式。”Corbett-Detig说。
这些内含子最常见于藻类、真菌和多样化的单细胞真核生物中,有一个例子是在海胆和一种管状海洋无脊椎动物中发现的。
物种间的转移
在他们分析的许多基因组中,研究人员首次直接证明了内含子的水平基因转移。他们发现了八个内含子从一个物种的基因组中跳出并定居在另一个无关物种的基因组中的例子,这些例子无法用交配来解释。
在一个例子中,研究人员发现在两个关系极为遥远的物种之间发生了水平基因转移,它们的最后共同祖先生活在16亿年前。在查看这两种物种——一种海绵和一种名为甲藻的海洋原生生物——的基因组时,他们发现大约4000万年前,一个内含子从其中一个物种跳到了另一个物种。
研究人员推测,内含子可能是通过巨型病毒在物种之间传播的。
“那病毒本身也是一个自私的元素,所以这就像是一个自私的元素搭载在另一个自私的元素上。”Corbett-Detig说。
尽管八个水平基因转移的例子看起来不多,但研究人员认为,如果继续在已知的874万种真核生物中寻找,会发现更多。
“鉴于我们只采样了很少一部分真核生物多样性,我保证你,如果我们采样其余的真核生物,我们会发现更多。”Corbett-Detig说。
(全文结束)


