能够即时准确地预测一个人未来数年的健康走向,长期以来被视为医学的巅峰成就。这类信息将对整个医疗保健系统产生深远影响——使医疗重心从治疗转向预防。
根据最近发表的一篇论文的研究结果,研究人员承诺实现这一目标。他们利用尖端人工智能(AI)技术,开发了德尔菲-2M工具。该工具旨在预测一个人在未来20年内可能发生的下一次健康事件及其可能发生的时间。该模型可预测包括癌症、糖尿病和心脏病在内的1000多种不同疾病。
为了开发德尔菲-2M,欧洲研究团队使用了来自英国生物银行近40.3万人的数据作为AI模型的输入。
在最终训练完成的AI模型中,德尔菲-2M基于一个人出生时的性别、身体质量指数、是否吸烟或饮酒,以及既往疾病时间线,预测其下一次疾病及其发生时间。
该模型能够以0.7的AUC(曲线下面积)进行这些预测。AUC汇总了假阳性和假阴性率,因此可以在理论环境中作为准确性的替代指标。这意味着该模型的预测在所有疾病类别中可解释为约70%的准确率——尽管这些预测的准确性尚未在实际结果方面进行测试。
随后,研究人员将该模型应用于丹麦生物银行数据,以检验其是否仍然有效。该模型能够以相似的理论准确率预测健康结果。
AI工具
该论文的目的并不是建议德尔菲-2M已经准备好供医生或在医疗领域使用。相反,它旨在展示团队提出的AI架构的威力,以及其在分析医疗数据方面可能带来的好处。
德尔菲-2M使用"变换器网络"进行预测。这是为ChatGPT提供支持的相同技术架构。研究人员修改了GPT2变换器架构,利用时间和疾病特征来预测何时以及会发生什么。
尽管其他健康预测模型过去也曾使用变换器网络,但这些模型仅设计用于对一个人患单一疾病的风险进行预测。此外,它们主要应用于规模较小的医院记录数据。
但变换器网络特别适合预测一个人患多种疾病的风险。这是因为它们可以轻松调整关注点,并能够从多个不同的数据点中解析出许多不同疾病之间的复杂相互作用。
德尔菲-2M也被证明比使用不同架构的其他多疾病预测模型略为准确。
例如,米尔顿模型使用了标准机器学习技术的组合,并将其应用于相同的英国生物银行数据。与德尔菲-2M相比,该模型对大多数疾病的预测能力略低——而且需要使用更多数据才能做到这一点。
此外,非变换器模型很难通过添加更多数据层来改进。这意味着这些模型无法像变换器模型那样轻松地适应和改进,以用于不同的环境和研究。
德尔菲-2M模型的特殊之处在于,它可以作为开源模型向公众发布,而不会损害患者隐私。作者能够创建模拟英国生物银行数据的合成数据,同时去除个人身份信息——而且不会显著降低预测能力。此外,德尔菲-2M比典型的AI变换器模型需要更少的计算资源进行训练。
这将允许其他研究人员从头开始训练该模型,并可能根据需要定制模型和信息。这对于开放科学的进步非常重要,在医疗环境中通常很难做到这一点。
为时尚早
无论德尔菲-2M是否会成为设计用于预测患者未来健康风险的AI工具的基础模型,它都证明了此类模型正在路上。
由于其分层架构和开源性质,未来类似德尔菲-2M的模型将继续通过整合更丰富的数据(如电子健康记录、医学影像、可穿戴技术和位置数据)而不断进化。这将随着时间的推移提高其预测能力和准确性。
然而,尽管预防疾病和提供早期诊断的能力前景广阔,但就这一预测工具而言,有几个关键注意事项。
首先,此类工具存在许多与数据相关的担忧。正如我们之前所写,AI工具接收的数据质量和训练决定了其预测的成败。
用于创建德尔菲-2M的英国生物银行数据集没有足够的多样化种族和民族群体数据,无法进行深入的训练和性能分析。
虽然德尔菲-2M研究人员进行了一些分析,表明添加种族和民族因素对结果影响不大,但在许多类别中仍缺乏足够的数据来进行评估。
如果在现实世界中使用,个人医疗保健数据可能会被使用并与德尔菲-2M等基础模型结合。虽然包含这些个人数据将提高预测准确性,但也带来了风险——例如个人数据安全和数据在非上下文中的使用。
将该模型扩展到医疗保健系统与设计数据集所用系统不同的国家也可能很困难。例如,将德尔菲-2M应用于美国环境可能更为困难,因为美国的医疗数据分散在多个医院系统和私人诊所中。
目前,德尔菲-2M尚不适合患者或医生使用。虽然德尔菲-2M基于用于训练它的数据提供了通用预测,但目前尚不适合将这些预测用于个体患者的个性化健康建议。
但希望随着对德尔菲-2M风格模型的持续研究和构建投资,将来有可能将患者的个人健康数据输入模型,获得个性化预测。
【全文结束】


