一组研究人员公布了一款AI模型,该模型可以预测一个人患上1000多种疾病的可能性,甚至还能估计这些疾病可能发作的时间。本周在《自然》杂志上描述的这款AI代号为Delphi-2M,该工具使用了来自英国和丹麦近230万人的匿名健康数据进行训练。这标志着迄今为止利用生成式AI绘制人类健康未来的最大规模努力之一。
与仅涵盖特定疾病(如心脏病、糖尿病)的传统健康计算器不同,Delphi-2M采取了整体方法。这意味着该AI工具实际上会模拟您数十年的健康可能轨迹,预测包括疾病、睡眠模式和其他影响健康的因素在内的并发症序列。
Delphi-2M的工作原理
基于ChatGPT等聊天机器人的相同技术,使Delphi-2M与大型语言模型(LLM)不同的是,它被设计用来处理病史而非文本。每个诊断结果、人口统计细节或生活方式因素都被编码为"标记",让AI能够以语言模型预测和书写下一个单词的方式分析疾病的发展进程。
关键输入包括:
- 年龄和性别
- 涵盖1000多种疾病的既往诊断
- 生活方式因素,如BMI、吸烟和饮酒
利用这些关键但相对基础的信息,该模型随后可以预测患者可能面临的下一种疾病以及该疾病出现前的时间长度。在测试中,它在英国数据集的数百种疾病上达到了平均准确率(AUC)0.76;考虑到人类健康的复杂性,这是一个相当不错的结果。
结果与局限性
正如研究中所提到的,当研究人员要求Delphi-2M为60岁人群生成合成健康未来时,其预测结果与十年后的人群级结果非常吻合。这表明它可能成为公共卫生规划的有力工具,例如识别哪些疾病可能在未来几代人中激增。
与任何AI一样,这项技术并非完美,存在局限性。当应用于丹麦数据时,准确率下降,表明该模型在不同人群中的可靠性并不均等。此外,像所有预测性AI一样,该模型反映了其训练数据集的偏见。例如,英国生物样本库(UK Biobank)的数据偏向于更富裕、更健康的参与者,这可能会扭曲对代表性不足群体的风险估计。
可信度如何?
重要的是要记住,人类监督绝对必要,AI不能取代人类医生。这就是为什么研究人员警告说,至少目前而言,Delphi-2M并非诊断工具。相反,研究人员认为它更像是一个有用的预测引擎,可以检测总体风险并规划预防性护理。预测您在72岁时患癌症的高风险并不意味着一定会发生,只是说明您与训练数据中患癌人群相似。
话虽如此,其可能性令人瞩目。未来可能会有更多像Delphi-2M这样的AI模型与现有健康计算器并列,为患者和医生提供更个性化的未来风险路线图,甚至揭示可以延迟或预防疾病的可行步骤。
核心要点
尽管这仍处于研究阶段,但AI指导医学的前景伴随着许多问题。让ChatGPT或Claude编写代码的相同生成技术,也能用于预测疾病吗?
Delphi-2M暗示了一个未来:您的医生可能会使用AI扫描您潜在健康旅程的数十年,帮助您在症状出现前很久就采取预防措施。
【全文结束】


