研究人员近日发布了一款可预测个人罹患1000多种疾病可能性的AI模型,该工具甚至能预估疾病可能发作的时间。本周发表在《自然》杂志的这项研究将该AI命名为Delphi-2M,其训练数据来自英国和丹麦近230万人的匿名健康记录,标志着利用生成式AI描绘人类健康未来走向的最大规模尝试之一。
与仅覆盖特定病症(如心脏病、糖尿病)的传统健康计算器不同,Delphi-2M采用整体方法。这意味着该AI工具实际模拟数十年间的健康轨迹演变,预测包括疾病、睡眠模式及其他健康影响因素在内的并发症序列。
Delphi-2M的工作原理
该模型基于ChatGPT等聊天机器人的底层技术构建,但与大语言模型的关键区别在于其专为处理医疗史而非文本设计。每项诊断、人口统计细节或生活方式因素均被编码为"标记",使AI得以像语言模型预测下一个单词那样分析疾病发展进程。
关键输入包括:
- 年龄与性别
- 涵盖1000多种病症的既往诊断记录
- 体重指数、吸烟及饮酒等生活方式因素
利用这些基础但关键的信息,模型可同时预测患者可能面临的下一种疾病及其发病时间。在测试中,该模型对英国数据集中数百种疾病的平均准确率(曲线下面积)达0.76,考虑到人类健康的复杂性,这一结果相当显著。
成果与局限
研究显示,当要求Delphi-2M为60岁人群生成模拟健康预测时,其十年后的预测结果与实际人群健康数据高度吻合。这表明它有望成为公共卫生规划的有力工具,例如识别未来可能激增的疾病类型。
但该技术并非完美。应用于丹麦数据时准确率下降,证明模型在不同人群中的可靠性存在差异。此外,如同所有预测性AI,该模型会反映训练数据集的偏差。例如英国生物银行数据偏向更富裕、更健康的参与者,可能导致对弱势群体的风险评估失真。
可信度评估
必须明确的是,人类监督不可或缺,AI绝不能替代医生。因此研究团队强调Delphi-2M目前并非诊断工具,而更像一种风险预测引擎,可用于检测整体风险并规划预防性护理。预测您72岁患癌风险高并不意味着必然发生,仅说明您与训练数据中患癌人群特征相似。
尽管如此,其潜力令人瞩目。未来可能出现更多类似Delphi-2M的AI模型,与现有健康计算器协同工作,为患者和医生提供个性化的未来风险图谱,甚至提出可操作的预防措施以延缓或避免疾病发生。
核心结论
尽管仍处于研究阶段,AI引导医疗的前景引发诸多思考:让ChatGPT或Claude编写代码的生成式技术,能否同样用于疾病预测?Delphi-2M预示着未来医生可能借助AI扫描您数十年的潜在健康历程,帮助您在症状出现前就采取预防行动。
【全文结束】