种族是社会构建还是遗传生物标志物?
由Chuck Dinerstein, MD, MBA撰写 — 2025年6月11日
“社会和生物学对多样性的理解一直在相互交织,有时它们可以产生积极的互动。但很多时候它们纠缠在一起,变得一团糟。”
- 约翰·卡恩,东北大学法律和生物学教授
在研究中使用种族越来越具有争议性。作为社会构建,它继续为社会科学提供有效的变量。然而,作为遗传生物标志物,其价值在简单问题上受到越来越多的质疑,例如算法预测肾脏和肺部疾病的能力。在遗传学研究中,这一问题变得更加复杂。基于NIH的“我们所有人”研究计划的一份新报告可能终结了我们可以沿种族线分类遗传和生理特征的信念。
“我们所有人”是由美国国立卫生研究院于2018年启动的一项纵向研究计划,旨在通过收集来自全美超过一百万不同参与者的健康数据来推进精准医学。这项发表在《美国人类遗传学杂志》上的新研究基于“我们所有人”的基因信息库,这是美国最大的生物库。在深入探讨之前,让我们先明确一些定义。
- 种族是自我报告的,反映了“在美国使用的政治认可的种族定义”。它是一种社会构建,因为种族分类不仅因国家而异,甚至因个人而异。
- 民族,看似更接近遗传学,也是一种社会构建;在美国,我们有两种民族,即西班牙裔或非西班牙裔。
- 祖先基于我们整个基因组中发现的遗传变异(等位基因),是我们起源的人类群体的遗传蓝图。它反映了我们的遗传继承,使其成为最相关的生物学分类。
研究人员检查了“我们所有人”收集的超过23万个无关个体的全基因组,重点关注200万个常见的遗传变异(SNP)以提高计算效率。他们应用主成分分析(PCA),这是一种统计技术,识别主要的遗传变异模式,称为主成分(PCs),以绘制人群结构和个人遗传祖先图谱。
研究人员最初识别出广泛的遗传变异梯度,而不是使用预定的基于人群的聚类。通过将结果投影到全球和其他已知参考面板上,他们可以将参与者置于全球背景中,并根据其DNA与已建立模式的对齐情况分配“未知”祖先。
混合分析补充了PCA,通过深入挖掘个体基因组中的特定祖先贡献,估计一个人的祖先来自多个历史源群体的比例。就像Ancestry.com的报告一样,这种技术量化了我们的祖先混合。
研究发现:
- 人类遗传变异并不完全符合我们的种族和民族分类。虽然识别出了五个广泛模式或主成分(PCs),但个体并未落入与其自我认同的种族和民族相对应的孤立、独特的遗传群体。祖先更加细微和复杂。
- 我们确实是一个全球大熔炉,拥有来自几乎所有国家和大陆的大量移民。“我们所有人”的遗传多样性通常超过了全球参考数据集,强调了我们人口的遗传丰富性。黑人或非洲裔美国人跨越了非洲和欧洲祖先之间的连续体。白人表现出主导的欧洲祖先,但也检测到了南亚、非洲和美洲原住民的痕迹。西班牙裔和拉丁裔很少认同特定的种族类别,即使他们这样做,也涵盖了整个范围:非洲、美洲原住民和欧洲。
- 混合分析识别出13个可能的“全球”祖先集群,揭示了每个自我认同的种族和民族类别内的个体祖先比例存在相当大的变异性。我们都是混血儿。
- 这些混合比例在美国各州之间有所不同,反映了我们从哪里来(自愿或被迫)以及到达后我们去了哪里,例如大迁移或沙尘暴带来的迁移。南方白人更多来自南欧,中西部白人则来自北欧。西班牙裔或拉丁裔参与者在西南部显示出更多的美洲原住民祖先,在东北部(例如纽约)则显示出更多的非洲祖先。
不要把婴儿和洗澡水一起倒掉
分析显示,当考虑社会文化和环境因素时,祖先与生物特征之间的关联减弱了。生物特征,如身高和BMI,不仅受遗传因素影响,还受复杂的环境因素影响。虽然祖先有意义地贡献——例如,北欧和西中非祖先与较高的身高相关,而美洲原住民和南亚祖先与较矮的身高相关——但这些模式在研究人员考虑收入、教育、邮政编码甚至出生国等因素时发生了变化。
将自我认同的种族和民族添加到他们的模型中改善了对BMI和身高等特征的预测,不是因为这些类别代表遗传学,而是因为它们有助于捕捉环境和社会影响,如饮食、压力和医疗保健获取。例如,美洲原住民祖先与较高的BMI相关,而东非祖先则显示相反的趋势,强调了次大陆群体可以有明显不同的甚至相反的生物学模式。
一些结论
- 调查和人口普查中使用的种族和民族反映的是文化和社会身份,但不能可靠地捕捉我们的遗传祖先。
- “我们所有人”数据集并未完全涵盖所有全球祖先。一些美洲原住民、中东、南亚和非洲狩猎采集者群体仍然代表性不足,突显了在全球遗传研究中需要包容性采样的持续需求。
- 遗传祖先在这些群体内部和不同美国地区之间差异很大,强调了评估细粒度祖先以控制混淆并推进精准医学的必要性。
- 要了解基因如何影响健康,我们必须同时考虑人们居住的地方、他们如何认同以及塑造他们生活的环境。
该研究强调了将大陆祖先视为单一、统一类别的重要性,而应将其视为反映非洲、美洲、亚洲和欧洲内丰富区域变异的马赛克。
种族是遗传学的糟糕代理,但在某些情况下,它作为结果的代理更好,尤其是在社会经济因素为主要决定因素时。将遗传祖先与社会身份分开既不简单也不总是可能。像身高和BMI这样的特征既受遗传变异的影响,也受我们生活环境的影响。将种族和民族纳入模型并不是对种族作为生物学的认可;而是认识到社会类别编码了影响健康的现实世界差异,即使它们间接地这样做。
研究人员建议未来的研究调整关联模型,优先直接测量环境因素,而不是使用种族或民族作为代理——只有在没有更好的数据可用且其预测价值得到实证支持时才保留这些代理。不幸的是,这可能需要比我们目前拥有的更细致的理解生物学和社会是如何共同演化的。
(全文结束)


