作者:玛丽·卡弗里(Mary Caffrey)
事实核查:罗斯·麦克努尔蒂(Rose McNulty)
关键要点
- 精准医疗模型通常依赖北欧人群数据,导致治疗不平等现象。
- 遗传多样性对于理解疾病风险和治疗效果至关重要,急性淋巴细胞白血病的研究证明了这一点。
- 骨髓类器官和癌症依赖性图谱等创新工具旨在纳入多样化的遗传数据。
- 需要开发考虑祖先背景的CRISPR文库,以解决当前基因组数据中的偏见并改进药物发现。
美国血液学会(ASH)的一个专家小组强调了癌症研究中遗传多样性的迫切需求,探讨了不同祖先背景患者治疗结果的差异问题。
在今年的美国血液学会年会上,马里兰大学医学院的圣弗勒-洛米尼(Shella Saint Fleur-Lominy)博士展示了利用ECOG-ACRIN细胞遗传学和新诊断急性髓系白血病(AML)患者结果数据的研究,以更好地了解NPM1突变对生存益处的祖先背景效应。圣弗勒-洛米尼和她的团队拼凑了他们自己的数据集——这是由于人口登记册存在缺口所必需的——他们的努力在ASH新闻项目中于周六进行了展示,突显了精准医疗时代的一个巨大不平等现象:
如果用于决定靶向治疗的模型不能代表所治疗的患者,那么可以做些什么来解决这个问题?
周六上午晚些时候,ASH的一个专家小组在"利用临床前发现中的遗传多样性指导精准医疗"会议上试图回答这个问题。该会议由加州大学欧文分校的临床和转化基因组学专家索菲·扎伊杰尔(Sophie Zaaijer)博士和俄亥俄州立大学综合癌症中心詹姆斯癌症医院的副教授安-卡特琳·艾斯费尔德(Ann-Kathrin Eisfeld)博士共同主持,邀请了3位研究人员分享基础生物医学研究如何填补推动开发、疾病建模和临床决策的基础数据中的空白。
扎伊杰尔解释说,问题在于精准医疗模型中使用的算法 overwhelmingly 基于北欧后裔的DNA;《自然·遗传学》杂志的一项令人震惊的报告估计,全基因组关联研究(GWAS)中96%的数据都来自这些人群。
尽管FDA呼吁在临床试验中更好地代表不同人群,特别是在肿瘤学领域,数据集并没有迅速多样化:在导致药物批准的试验中,黑人或非裔美国人的比例不到5%,尽管他们占美国人口的14%。
扎伊杰尔明确指出一点:"这不是AI可以解决的。有时人们提到AI可能会加速,"她说。因为人工智能只能从用于喂养算法的数据中学习,关键在于创建更好的数据——而会议演讲者描述了如何 painstakingly 地做到这一点。
首先是基本遗传学:尽管只有少数等位基因对特定人群群体真正独特(所谓的群体私有等位基因),但大多数等位基因实际上在不同人群中以不同频率共享。"所以,当你现在只关注一个人群群体时,你基本上降低了在测试药物时看到某些等位基因的机会,"扎伊杰尔解释道。
人类细胞模型和骨髓类器官
波士顿儿童医院Megakaryocytes to Platelets研究组首席研究员凯莉·马赫卢斯(Kellie Machlus)博士首先澄清了种族、民族和祖先在生物医学研究中的使用方式。她说,种族和民族是社会、文化或地缘政治的构建,只有祖先是从DNA中得出的可测量生物参数。"种族仍然是祖先的替代标记,"她解释说,"祖先是我们用来定义人类群体间遗传差异的框架。"
马赫卢斯的实验室将骨髓类器官作为祖先知情精准医疗研究的工具,她说这些工具符合忠实捕捉骨髓微环境和重现髓系空间的标准。这些类器官需要18天发育;该过程包括以密切模拟体内条件的方式将前血小板释放到血管系统中。移植过程允许添加患有骨髓纤维化、多发性骨髓瘤或慢性髓系白血病患者的细胞,例如。
然后,马赫卢斯说,"然后我们可以像在诊所中一样用药物治疗这些类器官。所以,这确实是朝着精准医疗方法迈进。"
尽管类器官的保质期相对较短,她说,"这些细胞在液体培养中存活的时间要长得多。"
尽管这项技术很有前景,马赫卢斯说仍需进行大量验证工作。"我们显然必须证明这些对个体反应、治疗效果和毒性的预测是准确的。这是我们所有人都必须确保或继续努力的事情,"她说。
遗传祖先与急性淋巴细胞白血病
南加州大学凯克医学院人口与公共卫生科学助理教授亚当·德史密斯(Adam de Smith)博士接下来研究了遗传变异和祖先如何导致急性淋巴细胞白血病(ALL)发病率和结果的差异。西班牙裔/拉丁裔儿童被诊断为ALL的人数比非西班牙裔白人儿童多40%,德史密斯说这种高风险在整个生命周期中持续存在。
这种增加似乎特定于B细胞免疫表型,"这指向了一些潜在的生物学,"他说。"除了发病率的差异外,我们还知道在患者结果方面存在种族和民族差异。"
尽管治疗方法有所进步,但德史密斯说这种差异仍然存在,由健康的社会决定因素、环境因素、肿瘤生物学和遗传因素驱动,包括遗传祖先。
证据显示的一个因素是,具有更多美洲原住民或美洲土著祖先的西班牙裔儿童生存率更差。"他们的基因组由美洲土著、欧洲和非洲成分的遗传祖先组成,"他说。
注意到马赫卢斯已经解释了种族、民族和遗传祖先之间的差异。"我们可以描述每位患者个体的遗传祖先比例,或者我们可以使用测序数据或SNP基因分型数据推断该祖先,"他指的是单核苷酸多态性,"其中每位个体的祖先比例反映了其基因组中遗传变异或SNP的分数,这些变异或SNP的频率与参考人群中的频率最为相似。"
一个人可能是非洲、欧洲或美洲土著起源,他说。"这些祖先比例总和为100%,因此遗传祖先与种族和民族相关,但它捕捉到更复杂的人口起源,并可以捕捉到可能影响疾病风险和患者结果的不同暴露或因素。"
他解释说,那些来自墨西哥或秘鲁的人比来自波多黎各的人有更多的美洲土著祖先,后者基因组中欧洲和非洲祖先的贡献更大,美洲土著祖先的贡献要小得多。
德史密斯的研究表明,与欧洲人群相比,许多ALL风险等位基因频率在西班牙裔/拉丁裔人群中偏向更高的频率。他确定了4个突出的变异:IKZF1、GATA3、ARID5B和21号染色体上的ERG SNP。
"尽管风险等位基因在两个人群中的频率相对相似,但我们发现ERG SNP对ALL风险的影响似乎特定于西班牙裔和拉丁裔人群,"他说。
通过将这些SNP与已知的GWAS位点结合到多基因风险评分(PRS)中,德史密斯的团队发现西班牙裔/拉丁裔人群中PRS显著向更高方向移动。即使是西班牙裔/拉丁裔对照组也比非西班牙裔白人对照组有更高的分数。
他深入研究了IKZF1基因的发现,该基因在西班牙裔/拉丁裔个体中显示出3个独立的风险关联,而在非西班牙裔白人中只有2个;西班牙裔/拉丁裔人群的一个新的风险变异与美洲土著祖先呈正相关。然后他追踪了这种变异的进化历史,展示了他如何分析了来自西半球各地的古代DNA样本,其中最古老的杂合形式样本可追溯到近13,000年前。
"为什么这种风险等位基因在美洲土著人群中变得如此普遍?"德史密斯问道。他推测,亚洲人穿越白令海峡到达现在的北美后发生的"人口瓶颈"导致了这种发展,而在近几个世纪,随着具有欧洲和非洲祖先的人的到来,这种情况已经得到缓解。
这些发现直接影响体细胞改变和患者结果。研究表明,具有更高美洲土著祖先的西班牙裔/拉丁裔患者复发风险更高,某些体细胞亚型如Ph样(BCR-ABL样)ALL和CRLF2重排在西班牙裔/拉丁裔患者中更为普遍。关键的是,即使在调整了分子亚型和临床特征后,非洲祖先和美洲土著祖先仍与较差的结果相关。这些是调查人员如圣弗勒-洛米尼试图通过直接进入临床试验数据来回答的问题,却发现数据严重不足。
CRISPR伪影和新治疗靶点
Broad研究所副主任杰西·博姆(Jesse Boehm)博士研究了收集更多样化数据如何与药物发现相关。他介绍了癌症依赖性图谱,这是一项国际倡议,旨在系统地了解癌症的脆弱性。该图谱允许研究人员创建代表每种人类癌症类型的细胞模型和类器官,对它们进行全基因组CRISPR筛选、系统药物测试和计算映射,以确定分子特征和治疗脆弱性之间的关系。
但有一个问题。
"不出所料——当今91%以上的临床前模型都来自欧洲或东亚祖先的患者,"博姆说。"我们显然在这个领域错过了巨大的基因组发现机会。现在,新的项目已经开始启动,试图填补其中的一些空白。"
其中一个项目,博姆参与其中,是人类癌症模型倡议。从超过2500名同意的患者中,已经开发了665个成功的长期模型,其中包括71个来自非欧洲捐赠者的新型类器官模型。博姆展示了一个按颜色编码的图表,标识了不同模型的祖先;代表欧洲祖先的绿色点亮了图表的大部分。但对于关键癌症,代表非洲祖先的橙色开始显现。
"你可以看到在一些队列中,如乳腺癌、结直肠癌、子宫内膜癌,我们开始捕获来自非欧洲血统患者的更多模型,并通过利用任何单个位点的局部祖先,我们在实验中使用的模型的总和可能很有用,即使特定模型的主要祖先来自欧洲或东亚血统的患者,"他说。"所有这些信息已经发布,现在可供科学界使用。"
博姆的团队在他们的CRISPR筛选中确定了49个假定的与祖先相关的依赖性。最初对这些发现感到兴奋,但他们在寻找答案的努力中发现了一个大问题。CRISPR引导RNA主要基于以欧洲为中心的参考基因组设计,当种系SNP存在于CRISPR靶向区域时,引导会导致假阴性信号——特别是在来自非欧洲祖先的细胞系中。
"我们做了一个评估,试图找出33个中哪些可能是导致依赖性的可能因果SNP,我们发现一个在整个基因组中高于假发现率的特定SNP看起来与依赖性相关,"博姆说。
经过进一步调查,"我们怀疑分析中可能存在一个伪影,阻碍了我们发现真正与祖先相关的信号的能力。而这正是结果。事实证明,这49个假定的与祖先相关的依赖性实际上是一个令人震惊的伪影,"他说。
该团队意识到这种不匹配挑战的范围很大,影响了许多重要的癌症基因,对于近期非洲血统的患者来说,由于与参考基因组相比具有更大的遗传多样性,差异要严重得多。博姆的团队采取了纠正措施,开发了计算方法来改进地图中的算法,防止这种伪影阻碍分析。这项工作推动了以祖先意识方式设计新的CRISPR文库,新的泛基因组参考将有助于解决这个问题。
还有很多工作要做。"当你消除伪影时,还有很多令人兴奋的事情有待发现,不仅仅是那几个与我展示的与祖先相关的依赖性,"他说。现在有17,000个GWAS分析需要重新审视,以了解该特定种系SNP是否与祖先相关。
"所以我们这样做了,"博姆说,称这个过程"计算量非常大。"该团队发现了大约100个与种系变异惊人相关的癌症依赖性。他向观众展示了涉及MUS81和EME1基因的复杂示例,该示例显示了与GEN1基因中特定SNP强相关的依赖性。该基因复合体内的关系涉及具有GEN1风险等位基因1个拷贝的肿瘤,可能会失去第二个拷贝,最终被MUS81抑制剂靶向。
当被问及没有数千个细胞系访问权限的小型实验室如何纳入祖先意识设计时,演讲者说在任何环境中强调基因组多样性都很重要。例如,马赫卢斯说确保健康的对照血小板样本来自年龄多样的捐赠者,而不仅仅是研究生。
德史密斯说,对于预算有限的祖先评估,为多样化人群设计的基因分型阵列每个样本大约100美元,可以使用公开可用的参考基因组数据分析。演讲者强调,祖先意识研究不需要巨大的样本量——它需要从一开始就进行有意的设计。
在当今连使用"多样性"一词都可能在资助过程中引起警报的时代,这项工作如何蓬勃发展?
"我们必须能够非常清楚地说明这是一个科学上的必要性。这不仅仅是一个道德上的必要性,"博姆说。
参考文献
- Saint Fleur-Lominy S, Chen L, Sun Z, et al. Inferior survival in black AML patients treated with intensive chemotherapy in ECOGACRIN clinical trials is independent of cytogenetic profiles. Presented at: 67th American Society of Hematology Annual Meeting & Exposition, December 6-9, 2025; Orlando, FL. Abstract 290.
【全文结束】


