一个糟糕的夜晚睡眠可能导致整天头脑不清醒。但新研究表明,一晚的睡眠也可能包含关于多年后才会出现明显症状的疾病和健康问题的线索和预测。
在一次测试中,一个人工智能系统利用夜间生理信号来估计一个人未来100多种健康状况的风险。这个名为SleepFM的模型是由斯坦福医学院研究人员及其合作者开发的。
该模型在近60万小时的多导睡眠图数据上进行了训练,这些数据来自约65,000人,使用的是那种追踪大脑、心脏、呼吸、运动等的整夜睡眠研究。
使用SleepFM挖掘数据
多导睡眠图通常被视为一种临床工具:你进行研究,评分睡眠阶段,寻找睡眠呼吸暂停,然后继续。研究团队认为,这只是这些记录所包含信息的一小部分。
"当我们研究睡眠时,我们会记录大量信号,"斯坦福大学睡眠医学教授、共同资深作者埃马纽埃尔·米尼奥特(Emmanuel Mignot)说。
"我们研究的是一个完全受控对象八小时的一般生理状态。它包含非常丰富的数据。"
直到最近,问题在于人类和标准软件只能消化这么多复杂性。
人工智能至少在理论上改变了这一状况,通过学习数千个夜晚和多个身体系统的模式。
人工智能与睡眠研究
医疗人工智能在放射学和心脏病学等领域蓬勃发展。尽管睡眠位于大脑功能、新陈代谢、呼吸和心血管健康交叉点,但这一领域却落后了。
研究共同资深作者周詹姆斯(James Zou)是生物医学数据科学副教授。
"从人工智能的角度来看,睡眠相对研究不足。有很多其他人工智能工作正在研究病理学或心脏病学,但相对较少关注睡眠,尽管睡眠是生活中如此重要的一部分,"周说。
这一差距塑造了团队的方法。他们没有为单一任务构建模型,而是开发了一个基础模型,旨在先学习广泛模式,然后适应特定预测。
SleepFM与睡眠语言
SleepFM的训练方式类似于大型语言模型,但不同于词语,它从生理学的小片段中学习。
多导睡眠图记录被切成五秒的片段,因此模型可以将长夜处理为序列,并学习什么通常跟在什么之后。"SleepFM本质上是在学习睡眠的语言,"周说。
该模型同时拉入多个通道,包括脑电图信号用于大脑活动,心电图用于心律,肌电图用于肌肉活动,以及脉搏和气流数据。
为可靠性训练模型
目标不仅仅是阅读每个通道。而是要理解这些通道如何相互关联。
为此,研究人员创建了一种训练方法,旨在让模型填补空白。一个数据流会被隐藏,模型必须从其他数据中重建它。
"我们在本工作中取得的一项技术进步是弄清楚如何协调所有这些不同的数据模式,使它们能够共同学习同一种语言,"周说。
训练后,团队针对熟悉的睡眠医学任务对SleepFM进行了微调。他们测试了它是否能够分类睡眠阶段并评估睡眠呼吸暂停的严重程度等标准指标。
在这些基准测试中,该系统的性能等于或优于该领域已使用的领先模型。
这一步很重要,因为它表明该模型不仅仅是学习噪音。它可以在被要求做更雄心勃勃的事情之前可靠地完成基本任务。
睡眠数据与疾病风险
然后出现了真正的突破:从一晚的睡眠预测未来疾病。为此,研究人员将睡眠数据与长期医疗结果配对,使用了主要睡眠诊所数十年的患者记录。
斯坦福睡眠医学中心由已故的威廉·德门特(William Dement)于1970年创立。在这个项目中,最大的数据集来自约35,000名年龄在2至96岁之间的患者,他们的多导睡眠图测试记录于1999年至2024年之间。
该团队将这些睡眠研究与电子健康记录匹配,为某些个体提供了长达25年的随访数据。
SleepFM扫描了1000多种疾病类别,并确定了130种仅使用睡眠数据就能以合理准确性预测的疾病。
提前数年预测疾病
对于癌症、妊娠并发症、循环系统疾病和精神障碍,报告的结果最为显著,这些组的C指数超过0.8。
C指数是一种评分方式,用于衡量模型在人群中排名风险的程度。它不是关于一个人的确定性。而是关于模型是否倾向于将高风险个体排在低风险个体之上。
"对于所有可能的个体对,模型给出了谁更可能更早经历事件(例如心脏病发作)的排名。C指数为0.8意味着80%的情况下,模型的预测与实际发生的情况一致,"周说。
该模型对几种特定结果表现特别出色,包括帕金森病、痴呆症、高血压性心脏病、心脏病发作、前列腺癌、乳腺癌和死亡。
"我们惊喜地发现,对于相当多样的一组状况,该模型能够做出有信息量的预测,"周说。
SleepFM模型"看到"的内容
即使有出色的表现数字,明显的问题仍然是:SleepFM到底捕捉到了什么?团队表示,他们正在开发解释工具,并可能尝试通过添加可穿戴设备的数据来提高预测。
"它不会用英语向我们解释,"周说。"但我们已经开发了不同的解释技术,以找出模型在做出特定疾病预测时正在看什么。"
已经有一个模式脱颖而出。最准确的预测不是来自单个通道。它们来自于比较通道并发现不匹配。
"我们获得预测疾病的最多信息是通过对比不同通道,"米尼奥特说。
换句话说,可能是身体不同步发出了危险信号。例如,大脑看起来睡着了而心脏看起来"清醒",可能暗示更深层次的问题。
这项研究发表在《自然·医学》杂志上。
【全文结束】

