AI模型绘制终身疾病风险图谱以变革未来医疗保健规划

AI model maps lifetime disease risks to transform future healthcare planning

英国英语科技与健康
新闻源:unknown
2025-09-21 02:20:48阅读时长5分钟2277字
AI模型疾病风险图谱健康轨迹个性化健康风险多病共存德尔菲-2M疾病预测医疗保健规划合成健康轨迹隐私保护研究

一款强大的新型AI可预测1000多种疾病在人一生中的发展过程,为精准预防、政策规划和消除偏见的医疗创新打开了大门。

研究:使用生成式Transformer学习人类疾病的自然史。图片来源:Song_about_summer / Shutterstock

在最近发表在《自然》杂志上的一项研究中,研究人员开发了一种机器学习模型,利用大规模健康数据根据患者的既往病史预测1,256种不同ICD-10三级疾病的进展。

该模型展示了与分析单一疾病的现有工具相当的预测准确性。它显示出模拟未来长达二十年健康轨迹的潜力,并为个性化健康风险和合并症提供了见解。

复杂疾病模型的需求

人类疾病进展涉及健康期、急性疾病期和慢性疾病期,通常表现为受遗传、生活方式和社会经济因素影响的合并症集群。

理解这些模式对于提供个性化医疗保健、生活方式指导和实施有效的早期筛查计划至关重要。然而,传统算法主要针对单一疾病设计,无法捕捉1000多种已知健康状况的复杂性。

在人口老龄化的背景下,这种局限性变得尤为重要,因为癌症、糖尿病、心血管疾病和痴呆等疾病的负担预计将在未来几十年显著增加。因此,准确建模疾病轨迹对医疗保健规划和经济政策都至关重要。

人工智能,特别是大型语言模型(LLMs),提供了一个有希望的解决方案。这些模型擅长学习数据序列中的依赖关系,就像基于先前健康事件预测疾病一样。

受这一类比的启发,研究人员已经开发出基于Transformer的模型来预测特定疾病状况,并取得了令人鼓舞的初步结果。然而,尽管取得了这些进展,一个能够全面模拟随时间变化的多病共存全谱的真正综合性和生成性模型尚未得到系统评估。

开发大规模数据模型

研究人员创建了德尔菲-2M(Delphi-2M)模型,这是一种基于Transformer的模型,用于预测终身疾病轨迹。与处理单词的语言模型不同,德尔菲-2M处理来自国际疾病分类第十版(ICD-10)的诊断代码,以及死亡、性别、BMI和吸烟、饮酒等生活方式因素。

为了解决医疗记录中的空白问题,研究团队插入了人工"无事件"标记。该模型包括性别和生活方式标记,词汇表涵盖疾病代码、生活方式水平、性别、"无事件"和填充标记(总计约1,270个)。

训练基于来自英国生物银行的大规模健康记录,包括402,799名参与者用于训练,100,639名用于验证,以及471,057名用于纵向测试。为了测试泛化能力,该模型还在来自193万丹麦个体的数据上进行了验证。

对基础模型进行了几项修改以适应健康数据:用连续年龄编码替换位置编码,添加输出头以预测下次事件的时间,并修改注意力掩码以防止同一时间点的标记相互影响。

德尔菲-2M能够估计1000多种疾病的风险,预测诊断时间,并模拟完整的健康轨迹。通过超参数调优优化了性能,最终得到一个220万参数的模型,该模型结合了预测准确性和生成能力,为建模多病共存和长期健康进展提供了新方法。

*a,基于ICD-10诊断、生活方式和健康填充标记的健康轨迹示意图,每个标记在不同年龄记录。b,来自英国生物银行(左)和丹麦疾病登记(右)的训练、验证和测试数据。c,德尔菲模型架构。红色元素表示与基础GPT-2模型相比的更改。'N ×'表示依次应用Transformer块N次。d,包含(年龄:标记)对的模型输入(提示)和输出(样本)示例。e,德尔菲的缩放规律,显示不同训练数据规模下模型参数的最优验证损失。f,通过相对于基于年龄和性别的基线的交叉熵差异(y轴)测量的消融结果,针对不同年龄(x轴)。g,预测事件时间的准确性。每个下一个标记预测(灰色点)显示了观察到的(y轴)和预期的(x轴)事件时间。蓝线显示x轴连续分箱的平均值。

评估模型性能

德尔菲-2M的性能使用英国生物银行63,622名参与者60岁前的健康数据进行了评估。该模型生成了模拟健康轨迹并与实际结果进行了比较。

70岁和75岁疾病率的预测与观察到的模式非常吻合,证实了其捕捉人群发病率趋势的能力。虽然预测准确性在更长时间范围内有所下降,从平均AUC(曲线下面积)约0.76降至10年时的约0.70,但德尔菲-2M仍然优于仅基于年龄和性别的模型。

该模型有效地区分了由生活方式或既往疾病定义的亚组风险,支持其在个性化风险分析方面的价值。

重要的是,德尔菲-2M还可以生成反映现实世界疾病模式的合成健康轨迹,而不会复制个人记录。仅在这些合成数据上训练的模型保留了原始模型的大部分性能,AUC仅下降3个百分点。这突显了其在保护隐私研究中的潜在应用。

为了理解预测,研究人员检查了嵌入空间,揭示了与ICD-10章节一致的疾病集群,并显示了特定诊断如何影响结果,例如胰腺癌对死亡率的强烈影响。

在丹麦数据上的外部验证确认了泛化能力,平均AUC约为0.67,尽管性能略有下降。最后,研究承认了其局限性,包括英国生物银行招募过程中的偏差和缺失数据的模式。

结论

该研究介绍了德尔菲-2M,这是一种基于GPT的模型,能够预测和模拟多种疾病随时间的进展。与单一疾病或生物标志物模型相比,德尔菲-2M在预测1000多种疾病的健康风险方面表现出强大的准确性。

然而,在糖尿病风险方面,其表现低于单一标记物HbA1c方法,尽管在丹麦数据上测试时性能仅有小幅下降。

它能够抽样合成未来轨迹的能力允许估计长期疾病负担并创建保护隐私的数据集。该模型还突显了合并症模式和疾病的时序影响,例如癌症带来的持续死亡风险,并在预测死亡方面达到了约0.97的AUC。

然而,研究也指出了几个局限性。预测反映了英国生物银行数据中的偏差,包括健康志愿者效应、招募偏差和缺失数据模式。在不同祖先和 socioeconomic 群体中也观察到差异。重要的是,该模型捕捉的是统计关联而非因果关系,这限制了其直接临床应用。

总体而言,德尔菲-2M展示了基于Transformer的模型在个性化风险预测、医疗保健规划和生物医学研究方面的潜力。未来的改进可能整合多模态数据,支持临床决策,并帮助老龄人口的政策制定。

【全文结束】

声明:本文仅代表作者观点,不代表本站立场,如有侵权请联系我们删除。

本页内容撰写过程部分涉及AI生成(包括且不限于题材,素材,提纲的搜集与整理),请注意甄别。