AI模型可提前数十年预测1000多种疾病风险AI Model Predicts Risk for 1,000 Diseases Decades in Advance

AI与医疗健康 / 来源:www.insideprecisionmedicine.com德国 - 英语2025-09-21 02:11:22 - 阅读时长3分钟 - 1396字
欧洲分子生物学实验室(EMBL)在德国海德堡的研究人员与德国癌症研究中心(DKFZ)和丹麦哥本哈根大学合作,开发出一种名为Delphi-2M的人工智能模型,该模型利用英国生物银行40万名参与者的健康数据,通过分析医疗历史事件序列(包括诊断、个人信息和生活方式因素),能够提前二十年预测1000多种疾病(如癌症、糖尿病、心脏病等)的发生风险。研究团队在英国和丹麦两个独立医疗系统中验证了模型的准确性,发现其对具有清晰进展模式的疾病预测效果较好,但对心理健康障碍等变异较大的疾病预测效果有限,且因训练数据主要来自40-60岁人群,存在年龄和种族代表性不足的问题。尽管尚未达到临床应用标准,该模型已可用于理解疾病发展规律和模拟健康结果,为未来个性化预防医疗提供新途径。
AI模型疾病风险预测健康记录个性化医疗预防性医疗癌症糖尿病心脏病心理健康障碍妊娠并发症
AI模型可提前数十年预测1000多种疾病风险

欧洲分子生物学实验室(EMBL)在德国海德堡的研究人员与德国癌症研究中心(DKFZ)和丹麦哥本哈根大学合作,开发了一种人工智能模型,该模型利用大规模健康记录来理解人类健康随时间的发展,并预测未来二十年内超过1000种疾病发生的风险。

欧洲分子生物学实验室临时执行主任Ewan Birney博士表示:"我们的AI模型是一个概念验证,表明AI可以学习我们的许多长期健康模式,并利用这些信息生成有意义的预测。通过模拟疾病随时间的发展,我们可以开始探索某些风险何时出现以及如何最好地规划早期干预措施。这是迈向更加个性化和预防性医疗保健方法的一大步。"

这项发表在《自然》杂志上的研究题为"利用生成式变换器学习人类疾病的自然史",研究人员在来自英国生物银行(UK Biobank)40万名参与者去标识化的患者数据上训练了一种名为Delphi-2M的AI模型。

该AI模型通过这些健康数据进行训练,学习将人们的医疗历史建模为随时间展开的事件序列。这些事件包括基于ICD-10顶级诊断代码的不同医学诊断、个人信息(包括性别和体重指数),以及吸烟和饮酒等生活方式因素,以及随后的死亡情况。

基于这些先前的健康诊断、生活方式因素和其他相关信息,研究人员的AI模型可以学习终生健康轨迹,并准确预测未来1000多种疾病的发生情况,包括不同类型的癌症、糖尿病、心脏病发作和死亡。

该研究的合著者、英国欣克斯顿EMBL欧洲生物信息学研究所的工作人员Tom Fitzgerald解释道:"医疗事件通常遵循可预测的模式。我们的AI模型学习这些模式并可以预测未来的健康结果。它为我们提供了一种基于个人医疗史和其他关键因素探索可能发生情况的方法。关键的是,这不是确定的,而是对潜在风险的估计。"

研究人员通过在两个完全独立的医疗保健系统——英国生物银行和来自丹麦国家患者登记处的190万患者数据——上测试他们的AI模型,验证了其有效性。

此外,他们发现该模型在预测具有清晰且一致进展模式的疾病(如特定癌症、心脏病发作和一种称为败血症的血液中毒)时成功率更高。对于心理健康障碍或与妊娠相关的并发症等疾病,由于这些疾病更具变异性并受不可预测的生活事件影响,AI模型更难预测。

研究人员在研究中强调,他们的AI模型只能提供概率,即在给定时间内某种疾病发生的可能性或机会,而非确定性。

尽管AI模型显示出巨大前景,特别是可以减轻医疗保健系统的负担并帮助医生识别高风险患者,但它也存在局限性。例如,AI训练的数据来自40至60岁的人群,这意味着年轻人的健康事件代表性不足。人口统计学偏见也是如此,训练数据不包括某些种族群体。

尽管该AI模型尚未准备好用于临床,但它已经可以用于了解疾病随时间的发展和进展、生活方式因素和医学诊断如何影响长期疾病风险,并且当难以获取真实世界数据时,它可以用于模拟健康结果。

该研究的合著者、DKFZ肿瘤学AI部门负责人、海德堡大学教授Moritz Gerstung博士表示:"这是我们理解人类健康和疾病进展的一种新方式的开始。像我们这样的生成模型有朝一日可以帮助大规模个性化护理和预测医疗保健需求。通过从大型人群中学习,这些模型为了解疾病如何展开提供了一个强大的视角,并最终可能支持更早、更有针对性的干预措施。"

【全文结束】