一组研究人员推出了一款AI模型,可预测个体罹患1000多种疾病的概率,甚至能估算这些疾病可能发作的时间。本周发表在《自然》杂志的该AI模型代号为Delphi-2M,其训练数据源自英国和丹麦近230万人的匿名健康信息。此举标志着利用生成式AI绘制人类健康未来版图的最大规模尝试之一。
与仅覆盖特定疾病(如心脏病、糖尿病)的传统健康计算器不同,Delphi-2M采用整体化方法。这意味着该AI工具能实际模拟数十年间个体的健康轨迹,预测包括疾病发作、睡眠模式及其他健康影响因素的并发症序列。
Delphi-2M的工作原理
Delphi-2M构建于类似ChatGPT聊天机器人的技术基础之上,其区别于大语言模型的关键在于专为处理医疗史而非文本设计。每个诊断结果、人口统计细节或生活方式因素均被编码为“标记”,使AI能像语言模型预测下一个单词那样分析疾病进展。
核心输入包括:
- 年龄与性别
- 涵盖1000多种疾病的既往诊断记录
- 体重指数、吸烟及饮酒等生活方式因素
利用这些关键但基础的信息,该模型不仅能预测患者可能面临的下一个疾病,还能预估疾病出现的时间跨度。在测试中,其针对英国数据集数百种疾病的平均准确率(AUC值)达到0.76;鉴于人类健康的复杂性,这一结果相当显著。
成果与局限性
研究指出,当研究人员要求Delphi-2M为60岁人群生成模拟健康未来时,其十年后的预测结果与实际人群数据高度吻合。这表明它有望成为公共卫生规划的有力工具,例如识别未来几代人中可能激增的疾病类型。
然而,如同所有AI技术,该模型存在局限。应用于丹麦数据时准确率下降,表明其在不同人群中的可靠性并不均衡。此外,作为预测型AI,该模型会反映训练数据集的固有偏差。例如,英国生物样本库数据倾向于更富裕、更健康的参与者,可能导致对代表性不足群体的风险评估失真。
可信度评估
必须明确的是,人类监督绝对必要,AI无法替代医生。因此研究人员强调,Delphi-2M目前并非诊断工具。研究团队将其定位为实用的预测引擎,用于识别总体风险并规划预防性护理。预测您72岁时癌症风险较高,并不意味着必然发生,仅表示您的特征与训练数据中患病人群相似。
尽管如此,其潜力令人瞩目。未来可能出现更多类似Delphi-2M的AI模型,与现有健康计算器协同工作,为患者和医生提供更个性化的未来风险路线图,甚至提出可操作的步骤来延缓或预防疾病。
核心结论
尽管仍处于研究阶段,AI引导医疗的前景引发诸多思考:能否将驱动ChatGPT或Claude编写代码的生成式技术,同样用于疾病预测?
Delphi-2M暗示着这样的未来:医生或可借助AI扫描您数十年潜在的健康旅程,帮助您在症状出现前采取预防行动。
【全文结束】