人类大脑特异性丝氨酸/苏氨酸激酶2(BRSK2),又称为Synapses of Amphids Defective (SAD)-A,主要在大脑表达并参与神经元极化和分化。该基因的5′非翻译区(5′ UTR)包含最长的五核苷酸短串联重复序列(STR),即(CGGCT)6。我们假设这种异常长度可能赋予人类认知功能的选择优势。我们在339名无关个体样本中对该区域进行了测序,其中包括晚期神经认知障碍(NCD)患者(N = 163)和匹配的对照组(N = 176)。随后,我们绘制了人类基因组中的CGGCT基序和STR图谱,并获得了包括啮齿动物、食肉目、偶蹄目、奇蹄目和灵长目在内的19种哺乳动物BRSK2序列跨越CGGCT STR的系统发育树。我们发现(CGGCT)6是一个由1至6次重复的17个连续CGGCT基序/STR组成的复杂岛的一部分,该岛延伸至BRSK2核心启动子和5′ UTR。在整个人类基因组中,这个CGGCT岛在CGGCT基序和重复的密度、复杂性和长度方面都是独一无二的。该岛在其下游被一个5′ UTR CGG STR所包围。CGGCT岛的进化主要与所研究物种的系统发生距离相吻合,而CGG STR是灵长类特有的,表明这一复杂序列的定向而非随机进化。虽然(CGGCT)6在所研究的人类样本中严格单态,但在对照组中检测到了该基序的7次重复。在CGGCT岛内的另一个CGGCT重复中,对照组中长等位基因(4次重复)的纯合性显著过剩(Mid-P = 0.02)。在同一位置,在NCD组中检测到3次重复的等位基因。此外,在NCD组中仅检测到CGG STR极端短和长长度的等位基因。携带不同基因型的患者的可能诊断包括阿尔茨海默病和血管性痴呆。
(全文结束)


