队列研究Cohort study - Wikipedia

AI与医疗健康 / 来源:en.wikipedia.org美国 - 英语2025-09-21 02:46:50 - 阅读时长6分钟 - 2988字
队列研究作为流行病学的核心研究方法,通过长期追踪具有共同特征的人群组(如出生队列),系统分析风险因素与疾病发生的关联性。该方法分为前瞻性与回顾性两类,在医学、公共卫生及社会科学研究中广泛应用,既能识别吸烟等风险因素与肺癌的因果关系,也可借助人工智能技术(如CohortNet系统)实现患者队列的自动化定义。尽管面临受试者流失和研究周期长等挑战,但其在病因探索和保护性因素验证方面的价值无可替代,著名的弗雷明汉心脏研究等项目已持续数十年,为人类健康研究提供关键证据基础。
队列研究健康疾病暴露因素风险因素保护性因素流行病学医学研究暴露-疾病关联吸烟与肺癌
队列研究

队列研究

一种纵向研究形式

队列研究是一种特定形式的纵向研究,它选取具有共同特征(通常是在特定时期经历共同事件的人群,如出生或毕业)的队列进行抽样,并在时间进程中定期进行横断面分析。它是面板研究的一种类型,其中面板中的个体共享共同特征。

队列研究代表了流行病学的基本设计之一,广泛应用于医学、药学、护理学、心理学、社会学及任何依赖循证(统计学)获取关键答案的研究领域。例如在医学中,虽然临床试验主要用于评估新药上市前的安全性,但流行病学分析则常用于探究风险因素如何影响疾病发生率,从而识别疾病根本原因,并为保护性因素(治疗手段)的可行性提供临床前依据。

与对照试验的比较

队列研究与临床试验的区别在于:队列设计中不对参与者施加任何干预、治疗或暴露,也不定义对照组。相反,队列研究主要关注特定人群的生活史及其构成个体。暴露因素或保护性因素被视为参与者的既存特征。研究通过在统计分析中纳入队列的其他共同特征进行控制。暴露/治疗变量和对照变量均在基线测量,随后长期追踪参与者以观察目标疾病或结局的发生率。回归分析可用于评估暴露或治疗变量对疾病发生率的贡献程度,同时控制其他潜在影响变量。

双盲随机对照试验(RCT)通常被视为治疗证据等级中的更优方法,因其能最大程度控制混杂变量,且随机化与盲法过程可减少研究设计中的偏倚。然而,队列研究通过基于先验研究和背景知识的假设,选择纳入回归模型的变量,并采用统计方法识别和校正潜在混杂因素。在队列选择阶段也可减轻偏倚。

当结局为负面健康影响且暴露因素被假设为风险因素时,RCT可能不适用。伦理标准和道德规范会阻止在RCT中使用此类风险因素。而自然或偶然暴露(如日光暴露时间)或自我施加的暴露(如吸烟)可在不改变参与者生活方式的前提下进行测量。

类型

队列研究可分为回顾性(回溯历史数据,如医疗记录或索赔数据库)或前瞻性(需收集新数据)。回顾性队列研究因信息受限于已有数据,研究者控制混杂和偏倚的能力较弱,但其优势在于成本更低、速度更快。

队列指在特定时期内具有共同特征或经历的人群组(例如现存活人群、接触药物/疫苗/污染物者或接受特定医疗程序者)。因此,某日或某时期出生的人群(如1948年)构成出生队列。对照组可为队列来源的总体人群,或另一组被认为暴露程度极低但其他特征相似的人群。也可比较队列内部的子群体。

应用

在医学中,队列研究常用于获取证据以反驳疑似因果关联。未能证伪假设通常会增强对其的信心。关键在于,队列需在疾病出现前即被确定。研究追踪无病人群一段时间,观察疾病新发病例。因此队列不能定义为已患病人群。暴露与疾病间的前瞻性队列研究能有力支持因果关联探究,但确定真正因果关系通常需进一步实验验证。

前瞻性队列研究的优势在于:通过长期追踪个体并定期收集数据,可减少回忆误差,有助于确定新发疾病的危险因素。然而,队列研究成本高昂、易受受试者流失影响且需长期随访才能产出有效数据。尽管如此,其长期研究结果的质量远优于回顾性/横断面研究,被视为观察性流行病学中最可靠的方法,能广泛研究暴露-疾病关联。

某些队列研究从儿童出生开始追踪,记录大量相关信息(暴露因素)。研究价值取决于研究者与队列成员保持联系的能力,部分研究已持续数十年。队列研究中,调查对象是处于特定疾病或健康结局风险中的人群。

实例

可回答的流行病学问题示例:X暴露(如吸烟)是否与Y结局(如肺癌)相关?1951年启动的英国医生研究即采用此类方法,比较吸烟者(暴露组)与非吸烟者(非暴露组),至1956年已证实吸烟与肺癌的明确关联。队列研究通过匹配经济地位等其他变量,使目标变量(自变量,此处为吸烟)能被隔离为因变量(此处为肺癌)的原因。若吸烟组肺癌发生率显著高于非吸烟组,则支持该假设。但肺癌等罕见结局通常不适用队列研究,而更适合病例对照研究。

在艺术领域,队列继替理论可解释文学、艺术、知识思潮、政治观点及语音学的多数变迁。

短期队列研究常用于临床试验,以测试特定临床假设。此类研究通常追踪两组患者,比较终点结局。

随机对照试验(RCT)因能通过随机分配减少偏倚,被视为证据等级中的更优方法。但若已有充分证据表明吸烟导致肺癌,则说服非吸烟者参与吸烟实验在伦理上不可接受。

持续50年以上的著名队列研究包括弗雷明汉心脏研究和英国出生队列研究(NCDS)。新西兰邓迪市1972-1973年出生的千人队列研究(邓迪多学科健康与发展研究)自2024年起进入第52阶段随访。规模最大的女性队列研究是始于1976年的护士健康研究,追踪逾12万名护士。非洲规模最大的队列研究是始于1990年的"出生至二十岁研究",追踪3000多名在曼德拉获释后出生的儿童。其他著名案例包括追踪1950年代哈佛毕业生的格兰特研究、追踪10,308名英国公务员的怀特霍尔研究,以及自1979年研究威尔士凯尔菲利镇2,512名男性的凯尔菲利心脏病研究。

ASPREE-XT研究旨在探究每日低剂量阿司匹林平均4-5年治疗的长期效果,结局指标包括癌症死亡率。截至2018年9月,澳大利亚有16,703名参与者。有提案建议将该研究扩展为多代际研究平台。

变体

现时与历史性队列

现时队列研究是真正的前瞻性研究,暴露数据在研究事件发生前收集。例如英国牛津计划生育协会研究,旨在全面评估不同避孕方法的利弊,已提供大量关于口服避孕药、子宫帽和宫内节育器的有效性与安全性的信息。

历史性队列研究在事件发生后收集暴露与疾病数据,参与者通过现存记录或医疗注册库确定。"前瞻性队列"在研究前定义分组,而历史性研究(有时称"回顾性队列")在数据收集后定义分组。历史性队列研究的实例包括《胃旁路手术后的长期死亡率》和《洛锡安出生队列研究》。

嵌套病例对照研究

嵌套病例对照研究是嵌入队列研究中的病例对照设计。其过程始于常规队列研究,当参与者出现目标结局时被选为病例,随后匹配对照组。病例选择与匹配流程与常规病例对照研究相同。实例包括从弗雷明汉心脏研究队列中提取的《炎症标志物与冠心病风险》研究。

嵌套设计的优势在于减少需详细随访或诊断测试的参与者数量,但相比原始队列会降低统计效力。

家庭面板调查

面板调查是另一种重要纵向研究子类型,其起点是代表性横断面样本而非事件定义的队列。家庭面板抽取代表性家庭样本并年度追踪所有成员。实例包括美国收入动态追踪研究(始于1968年)、德国社会经济面板(1984年起)、英国家庭面板调查(1991年起)及其继任者"理解社会"研究、澳大利亚家庭收入与劳动力动态调查(2001年起)以及欧洲社区家庭面板(1994-2001年)。

商业领域的队列分析

商业分析中的队列分析实例参见相关条目。

人工智能在队列研究中的应用

传统队列研究需手动定义共同特征,过程耗时费力且依赖专业知识。为突破此局限,研究者 increasingly探索整合AI技术(如CohortNet、COOL系统)以自动化队列识别。例如在医疗领域,可识别具有特定特征组合的患者构成特定队列,通常产生相似结局。识别队列后,进一步学习关联患者的共性并获取有意义的队列表征。此类AI衍生队列不仅能提升新患者评估能力,更有望加速医学研究与发现进程。

【全文结束】