研究团队近日公布了一款能预测个体罹患1000余种疾病概率的AI模型,该工具甚至能预估疾病发作时间。本周发表于《自然》杂志的这款代号为德尔菲-2M的工具,基于英国和丹麦近230万人的匿名健康数据训练而成,标志着生成式AI在绘制人类健康未来图景方面取得迄今最大规模突破。
与传统仅覆盖特定疾病(如心脏病、糖尿病)的健康计算器不同,德尔菲-2M采取整体化方法。该AI工具实际模拟个体数十年的健康可能轨迹,预测包括疾病发作、睡眠模式及其他健康影响因素在内的并发症序列。
德尔菲-2M的工作原理
该工具基于ChatGPT等聊天机器人的同类技术构建,但区别在于德尔菲-2M专为处理病史而非文本设计。每个诊断结果、人口统计细节或生活方式因素均被编码为“标记”,使AI能以语言模型预测下一个单词的方式分析疾病进展。
关键输入包括:
- 年龄与性别
- 涵盖1000余种疾病的既往诊断记录
- 体重指数、吸烟及饮酒等生活方式因素
利用这些基础但关键的信息,模型可同时预测患者可能面临的下一个疾病及其出现时间间隔。在测试中,该模型对英国数据集数百种疾病的平均准确率(曲线下面积)达0.76;鉴于人类健康的复杂性,这一结果相当可观。
成果与局限
正如研究中所述,当研究人员要求德尔菲-2M为60岁人群生成模拟健康未来时,其预测结果与十年后的人群级实际结果高度吻合。这表明它有望成为公共卫生规划的有力工具,例如识别未来世代中可能激增的疾病。
但与所有AI技术相同,该模型存在局限。应用于丹麦数据时准确率下降,显示其在不同人群中的可靠性不均等。此外,如同所有预测型AI,模型会反映训练数据集的偏差。例如,英国生物银行数据偏向更富裕、更健康的人群,可能导致对代表性不足群体的风险评估失真。
可信度评估
必须明确的是,人工监督绝对必要,AI无法替代人类医生。因此研究团队强调,德尔菲-2M目前尚非诊断工具。研究人员更倾向于将其视为风险预测引擎,用于识别普遍风险并规划预防性护理。预测72岁患癌高风险仅表明个体与训练数据中患病人群特征相似,并非必然结果。
尽管如此,其潜力令人瞩目。未来可能出现更多类似德尔菲-2M的AI模型,与现有健康计算器协同工作,为患者和医生提供更个性化的未来风险路线图,甚至提示可操作的步骤以延迟或预防疾病。
核心启示
尽管仍处于研究阶段,AI引导医疗的前景引发诸多思考:能否将驱动ChatGPT或Claude编写代码的生成式技术,同样应用于疾病预测?德尔菲-2M暗示着这样的未来——医生或许会借助AI扫描患者数十年潜在健康历程,在症状出现前就采取预防措施。
【全文结束】