新型AI工具预测20年内某人可能发展的1000种疾病
一种名为Delphi-2M的大型语言模型通过分析个人医疗记录和生活方式,为1000多种疾病提供风险评估
作者:Gemma Conroy & Nature杂志
一种新型人工智能(AI)工具可以预测一个人发展1000多种疾病的风险,在某些情况下可以提前数十年提供预测。该模型名为Delphi-2M,利用健康记录和生活方式因素来估计一个人在未来20年内发展诸如癌症、皮肤病和免疫系统疾病等疾病的可能性。尽管Delphi-2M仅在一个来自英国的数据集上进行了训练,但其多疾病建模有一天可能帮助临床医生识别高风险人群,从而提前实施预防措施。该模型在今天发表在《自然》杂志上的一项研究中进行了描述。
德国慕尼黑路德维希·马克西米利安大学的计算机科学家Stefan Feuerriegel表示,该工具一次性模拟多种疾病的能力"令人惊叹"。Feuerriegel曾开发用于医疗应用的AI模型。"它可以生成完整的未来健康轨迹,"他说。
健康预言家
研究人员已经开发了基于AI的工具来预测一个人患上某些特定疾病的风险,包括某些癌症和心血管疾病。但研究合著者、海德堡德国癌症研究中心的数据科学家Moritz Gerstung表示,这些工具大多只能估计一种疾病的风险。"医疗专业人员必须运行数十种这样的工具才能提供完整的答案,"他说。
为了解决这个问题,Gerstung和他的同事们修改了一种称为生成预训练变换器(GPT)的大型语言模型(LLM)类型,这是ChatGPT等AI聊天机器人的基础。当被问及问题时,GPT会根据其在大量数据上的训练提供统计上可能的输出。
作者设计了他们修改后的LLM,根据一个人过去的病史来预测其发展1,258种疾病的可能性。该模型还结合了个人的年龄、性别、体重等信息。
AI模型高精度预测多种疾病
一种名为Delphi-2M的新人工智能模型在同时预测个人发展多种疾病的风险方面展示了显著的进步。由剑桥大学的研究人员开发,该模型分析广泛的健康数据,预测心脏病、糖尿病和各种癌症等疾病的发作。研究结果于2025年9月发表在《自然医学》杂志上。
该模型最初使用来自英国生物银行(UK Biobank)的数据进行训练,这是一个包含50万名参与者基因和健康详情的大型生物医学数据库。Delphi-2M预测疾病风险的能力因其准确性以及同时处理广泛疾病的能力而引人注目,这与许多专注于单一疾病的先前AI模型不同。
为了评估其更广泛的应用性,研究人员在丹麦国家患者登记册(Danish National Patient Registry)的数据上测试了Delphi-2M,这是一个追踪近五十年医院入院情况的国家级数据库。该模型在丹麦数据上的预测表现仅略低于在英国生物银行数据上的表现。剑桥大学的研究员、该研究的主要作者Moritz Gerstung博士表示:"这表明当该模型应用于其训练所用之外的国家卫生系统数据集时,仍然可以做出某种程度上可靠的预测。"
尽管如此,Delphi-2M并非没有局限性。休斯顿德克萨斯大学健康科学中心的生物信息学研究员Degui Zhi博士将该模型描述为多疾病建模领域的一个"引人入胜"的贡献。Zhi指出,英国生物银行数据只记录参与者的首次疾病诊断。疾病频率和病史——一个人经历过某种疾病的次数——对"个人健康轨迹的建模"非常重要,Zhi解释道。这表明未来版本的模型可能会从纳入捕捉疾病重复实例的纵向健康记录中受益。
Gerstung和他的团队目前正在使用来自几个其他国家的数据集评估Delphi-2M的准确性,以进一步扩大其范围和普遍性。"思考如何结合这些信息来开发更精确的算法将很重要,"Gerstung补充道。研究人员希望改进该模型,提供更加个性化和准确的风险评估,最终有助于预防性医疗保健策略。
【全文结束】