一群研究人员发布了一款人工智能模型,该模型能预测个人罹患1000多种疾病的可能性,甚至能估算这些疾病可能发作的时间。本周在《自然》杂志发表的描述中,这款代号为Delphi-2M的工具基于英国和丹麦近230万人的匿名健康数据训练而成。此举标志着迄今规模最大的尝试之一,旨在利用生成式AI描绘人类健康的未来图景。
与仅覆盖特定病症(如心脏病、糖尿病)的传统健康计算器不同,Delphi-2M采用整体方法。这意味着该AI工具实际上会模拟数十年间可能的健康轨迹,预测包括疾病、睡眠模式及其他健康影响因素在内的并发症序列。
Delphi-2M的工作原理
该工具基于ChatGPT等聊天机器人的同源技术构建,但与大语言模型(LLM)的关键区别在于,它专为处理医疗历史而非文本设计。每个诊断结果、人口统计细节或生活方式因素都被编码为"标记",使AI能以语言模型预测并生成下一个单词的方式分析疾病发展进程。
关键输入包括:
- 年龄和性别
- 涵盖1000多种疾病的既往诊断
- 生活方式因素,如体重指数(BMI)、吸烟和饮酒
利用这些关键但相对基础的信息,模型随后预测患者可能面临的下一种疾病及其发作时间间隔。在测试中,它在英国数据集数百种疾病上达到了平均准确率得分(曲线下面积AUC)0.76;鉴于人类健康的复杂性,这已是显著成果。
成果与局限性
研究指出,当研究人员要求Delphi-2M为60岁人群生成合成健康未来时,其十年后的预测结果与人群层面的实际结果高度吻合。这表明它有望成为公共卫生规划的有力工具,例如识别未来世代可能激增的疾病。
与所有AI技术一样,该工具并非完美且存在局限。应用于丹麦数据时准确率下降,表明模型在不同人群中的可靠性不均等。此外,如同所有预测性AI,该模型反映了训练数据集的偏见。例如,英国生物银行数据偏向更富裕、更健康的参与者,可能导致对代表性不足群体的风险估计失真。
可信度评估
必须牢记人工监督绝对必要,AI不能替代人类医生。正因如此,研究人员强调Delphi-2M目前并非诊断工具。他们更倾向于将其视为有用的预测引擎,可检测普遍风险并规划预防性护理。预测您在72岁时患癌风险高并不意味着必然发生,仅表示您与训练数据中患病人群特征相似。
尽管如此,潜力令人瞩目。类似Delphi-2M的AI模型未来或可与现有健康计算器并行,为患者和医生提供更个性化的未来风险路线图,甚至揭示可操作步骤以延迟或预防疾病。
核心要点
尽管仍处于研究阶段,AI引导医疗的前景伴随诸多疑问:能否让驱动ChatGPT或Claude编写代码的生成技术,同样胜任疾病预测任务?Delphi-2M暗示了一个未来——医生可能运用AI扫描您数十年潜在的健康旅程,在症状出现前很久就助您采取预防行动。
【全文结束】