RESILIENT数据集:老龄化相关共病与认知衰退的多模态监测The RESILIENT Dataset: Multimodal Monitoring of Ageing-Related Comorbidities and Cognitive Decline | Scientific Data

环球医讯 / 认知障碍来源:www.nature.com英国 - 英语2025-10-23 13:22:14 - 阅读时长15分钟 - 7291字
RESILIENT数据集是由英国研究团队开发的一项重要医疗健康资源,包含73名患有多种长期疾病的老年人的多模态健康数据,涵盖生理指标、睡眠模式和认知功能评估。该研究开发了开源数字平台整合可穿戴设备和家庭监测技术数据,用于跟踪老龄化相关的共病和认知衰退,验证分析揭示了认知功能、心理健康、身体活动与睡眠质量之间的显著相关性。此数据集为开发预测模型提供基础,可用于早期检测认知衰退风险、减少计划外住院并改善老年人健康结果,同时为构建虚拟病房支持医疗服务提供了技术模型和初步验证,具有重要的临床应用价值和公共卫生意义。
老龄化共病认知衰退健康监测RESILIENT数据集可穿戴技术心理健康远程医疗预测模型睡眠质量身体活动
RESILIENT数据集:老龄化相关共病与认知衰退的多模态监测

摘要

老龄化人口增长和共病的普遍性给医疗保健带来了重大挑战,从住院率增加到痴呆风险。医疗保健系统主要治疗单一疾病,忽略了慢性疾病之间的复杂相互作用。可穿戴技术和远程医疗监测技术的进步为改善共病管理和早期干预提供了机会,以提高医疗保健效果。本研究介绍了RESILIENT数据集,这是一组生理、睡眠和心理健康评估数据,作为老龄化相关共病和痴呆研究的一部分进行收集。RESILIENT研究开发了一个数字平台,整合来自可穿戴设备和家庭监测技术的数据,以跟踪生理、睡眠和认知模式。使用RESILIENT数据进行的验证分析突显了认知功能、心理健康、身体活动和睡眠之间的相关性,与现有文献一致。通过利用此数据集,研究人员可以开发预测模型,用于早期检测和个性化干预,旨在减少计划外住院并改善健康结果。该研究为构建虚拟病房以支持和补充医疗服务提供了技术基础和初步验证。

背景与概述

全球范围内,长期疾病至少导致75%的死亡,其中大多数发生在中低收入国家。这些疾病的经济负担巨大,全球成本预计到2030年将达到47万亿美元,给全球医疗系统带来严重挑战。在英国,长期疾病占年度医疗和社会护理支出的70%,占全科医生(GP)就诊的50%,突显了它们对医疗系统造成的重大负担。通过预测性和预防性策略改变护理提供方式,有可能提高服务质量和患有这些疾病个体的生活质量。预防性策略也将减少与管理长期疾病相关的成本。在长期疾病中,高血压、糖尿病、心血管疾病和骨关节炎等共病通常与老年人认知能力下降和虚弱增加有关。这些共病不仅加剧认知障碍的进展,还使临床管理复杂化,并增加住院、护理院入住和死亡风险。RESILIENT项目旨在通过开发一个用于连续、家庭监测和多模态数据分析的系统,推进长期疾病患者的个性化医疗。这些数据用于开发长期疾病的预测模型和风险评估,并促进健康状况变化的早期检测。预测模型可以用作决策支持和洞察生成工具,实现及时干预并改善医疗保健结果。

需要一个在临床上适用且可扩展的平台,具备几项基本功能,以支持长期疾病患者的居家监测。这样的系统必须能够记录和更新全面的个人级信息,包括处方药、全科医生和医院就诊以及共存的慢性疾病。它应该包含一个面向用户的应用程序,使患者能够自我报告症状和体验。这将包括商业家庭传感技术无法轻易捕获的信息,如头晕、焦虑或疼痛。在开发RESILIENT项目中用于连续收集家庭监测数据的软件框架时,考虑了这些要求。这是由一个数据管理平台支持的,该平台整理和整合关键信息,包括人口统计学数据、心理健康评估、医生预约和住院。重要的是,完整的软件堆栈是公开提供的,以降低进行远程医疗监测研究所需的成本。

本文介绍的数据集来自RESILIENT项目。它包含从73名患有多种长期疾病的老年人参与者收集的多模态数据。这包括来自可穿戴和远程家庭监测设备的连续生理信号、身体活动和睡眠状态数据,以及人口统计学细节和经过临床验证的心理健康评估,如患者健康问卷(PHQ-9)、广泛性焦虑障碍量表(GAD-7)、老年抑郁量表(GDS-15)和Addenbrooke认知检查(ACE-III)。这些不同数据源的整合能够全面了解老年人的日常生活模式和健康轨迹。该数据集在开发和验证机器学习模型方面具有重要潜力,用于社区医疗中认知和功能下降的早期检测、预测风险评估和个性化干预策略。它可以支持更广泛的研究,探讨心理健康、共病和随时间的行为变化之间的关系。

本工作提出的主要贡献包括:

  • 我们提供了一个公共的开源存储库,包含用于收集、存储和分析家庭监测数据的软件
  • 我们公开提供了长达6个月的家庭生理、活动和认知评估数据
  • 我们提供了用于汇总和分析数据集的开源软件,包括汇总统计、按性别和年龄组分层的分析以及数据可视化
  • 该平台和验证数据集为在初级和二级医疗服务中构建虚拟病房以及为高风险群体提供改进的家庭监测提供了技术模型和初步数据

方法

RESILIENT数据集使用一个开源软件平台收集,该平台整合来自可穿戴和远程家庭设备的数据,用于连续健康监测。数据收集涉及经过伦理批准的程序,并获得参与者的知情同意,最终数据集已完全匿名化,以确保隐私和机密性。

RESILIENT平台

RESILIENT平台是一个开源数字解决方案,旨在整合来自远程医疗监测设备的数据,为用户和医疗专业人员提供全面的临床可视化并生成洞察报告。该系统遵循结构化架构,从Withings可穿戴设备获取数据,利用官方Withings API,该API提供对多种设备特定测量的访问。

该平台特别集成了两个Withings设备:ScanWatch和Sleep Mat。ScanWatch提供活动和心血管数据,包括步数和心率读数,每个都与相应的时间戳相关联。Sleep Mat捕获详细的睡眠相关指标,包括睡眠状态(带有开始和结束时间戳),以及睡眠生理参数,如心率、呼吸率、打鼾事件,以及在一分钟窗口内计算的心率标准差,所有参数都带有相应的时间戳。

用户通过Withings Health Mate应用程序进行身份验证,授予数据访问权限。身份验证过程由处理基础设施管理,该基础设施生成授权链接并将用户相应地重定向到Resilient Web应用程序。一旦授予授权,处理单元提取授权代码,实现安全数据获取。

RESILIENT平台架构的核心是一个专门负责处理医疗数据的模块。该模块处理传入的数据流并将它们存储在关系数据库系统中,该系统是使用Django Web框架开发的。数据库结构支持高效查询、安全数据管理和与报告及监测服务的无缝集成。存储的数据随后用于生成包含临床相关健康指标的详细PDF报告。同时,基础设施包含一个监控组件,持续跟踪连接的可穿戴设备的状态,包括它们的最新读数、连接状态和电池电量。

除了核心功能外,该平台设计为既适应性强又开源,允许无缝修改以适应特定设备要求。这种灵活性确保与其他可穿戴技术的兼容性,同时保持直观和用户友好的体验。根据FAIR性考虑,该平台支持功能级别的互操作性(例如,心率、睡眠阶段),从而实现与其他设备数据的集成。尽管当前实现基于Withings API,但底层数据格式结构允许回顾性协调,并可作为集成其他可穿戴API的模板。通过结合安全数据获取和可视化以生成每个人的每周或月度报告,该平台成为远程医疗监测的可靠工具。

参与者和伦理批准

符合研究条件的参与者是65岁或以上、被诊断患有至少两种增加痴呆风险的慢性健康状况的个体(例如,关节炎、慢性肾病、慢性阻塞性肺病、心脏病或心力衰竭、抑郁或其他心理健康障碍、糖尿病、高血压和肝病、中风),他们可以有或没有研究伙伴参与。表4总结了研究参与者的人口统计学特征,包括年龄、性别和主要共病。招募是通过英国东南部的Frailty Hubs、英国国家医疗服务体系(NHS)医院和全科医生诊所的临床医生进行的。临床医生推荐符合条件的患者或进行数据库搜索,并通过邮寄、电子邮件或短信发送邀请函。有兴趣的个人联系研究团队表示有意加入研究。患有严重心理健康问题(例如,严重抑郁、精神病、躁动或焦虑)、严重感官障碍、基线时接受终末期疾病治疗(预期寿命少于六个月或处于生命最后一年)或无法提供知情同意的个体被排除在研究之外。所有潜在参与者都收到了一份参与者信息表,概述了研究的性质、数据使用和保留政策,以及他们在《通用数据保护条例》(GDPR)下的权利。他们至少有24小时考虑参与,并鼓励在提供书面知情同意前与家人或护理人员协商。根据良好临床实践和《2005年精神能力法案》评估同意能力。同意包括同意参与以及收集、存储和共享符合NHS和GDPR数据保护标准的匿名和假名数据。主要研究者审查个别案例以确定最终资格。

RESILIENT研究已由伦敦-萨里边境研究伦理委员会和健康研究局审查和批准,并在综合研究申请系统(IRAS)上注册,参考编号为321104。这个公开可用的数据集包括远程医疗监测数据和监测期间进行的基线心理健康和认知评估,为分析健康趋势和检测认知和生理衰退的早期迹象提供了全面资源。

数据集收集

我们将可穿戴和家庭传感器数据与从REDCap记录中提取的个人医疗信息集成,以创建参与者福祉和护理需求的全面视图。

生理数据通过可穿戴和睡眠垫设备获取,这些设备持续收集并将数据传输到RESILIENT平台。在平台的处理基础设施内,来自每个设备的数据被预处理、去标识化、清理(去除冗余记录)并根据源设备合并。

本研究的心理健康、人口统计学和认知评估由监测团队直接联系参与者进行。数据集包括ACE-III、PHQ-9、GDS-15和GAD-7的基线评估,只有ACE-III有6个月的随访数据。ACE-III是一种认知筛查工具,评估五个领域:注意力、记忆、流畅性、语言和视觉空间功能,有助于检测认知障碍和痴呆。PHQ-9是一种自报告测量工具,用于根据《精神疾病诊断与统计手册》(DSM-5标准)评估抑郁症状的严重程度。GDS-15是一种简短、经过验证的筛查工具,专为检测老年人的抑郁症状而设计。GAD-7是一种包含七个项目的自报告问卷,用于评估广泛性焦虑症状的严重程度,在临床和研究环境中广泛使用。

数据集去标识化

数据应用了两阶段去标识化过程。在第一阶段,数据被假名化以开发研究的分析方法。在第二阶段,通过删除所有个人识别信息和任何可识别属性,数据被完全匿名化。参与者被随机分配一个通用唯一标识符(UID),以增强去标识化过程中的安全性。这确保了人口统计学和来自睡眠垫和扫描手表的原始监测数据无法追溯到个人,同时保留了数据的分析实用性。

在整个项目中,实施了强大的信息治理、控制方法和程序。进行了NHS批准的数据处理和影响评估,以监督数据收集、存储和访问程序。

数据记录

RESILIENT数据集在Zenodo上公开可用,并组织为四个主要部分:

  1. 一个CSV文件,包含所有参与者的人口统计学信息和与心理健康(PHQ-9、GAD-7、GDS-15)和认知功能(ACE-III)相关的基线评估。对于ACE-III,包括基线和6个月随访分数
  2. 一个描述人口统计学和设备数据中变量的元数据CSV文件
  3. 一个CSV摘要文件,提供每位参与者的数据覆盖统计信息,包括记录天数、平均每日记录数以及最早和最晚时间戳
  4. 包含原始时间序列数据的单个参与者文件夹,包括睡眠状态和睡眠垫捕获的生理特征,以及智能手表记录的步数和心率数据

更具体地说,每个参与者的文件夹中包含四个表:

  1. ScanWatch Steps表:记录手表在每个一小时间隔内检测到的步数,以及相应的时间戳
  2. ScanWatch HeartRate表:提供每10分钟测量的心率,以及它们各自的时间戳
  3. Sleep States表:记录当参与者在床上并位于智能睡眠垫上时在给定时间间隔内的四种睡眠状态(清醒、浅睡、深睡和REM)
  4. Sleep Physiology表:包含生理参数,如心率、呼吸率、打鼾和心率变异性(由一分钟窗口内的心率标准差表示)
  5. Demographics表:包含参与者的人口统计学信息,包括性别、年龄组和用于评估抑郁、焦虑和认知能力的四个评估分数:PHQ-9、GDS-15、GAD-7和ACE-III

由于采样频率的差异,这些变量记录在单独的表中。每个文件夹以参与者的唯一标识符(UID)命名,允许在设备数据和人口统计学信息之间进行交叉引用。通过使用Withings Sleep API提供的时间戳信息实现生理测量和睡眠状态数据之间的同步,使数据能够跨不同分辨率进行时间对齐。

图2显示了随时间累积的参与者数量和参与持续时间的分布。值得注意的是,此数据集中任何参与者的最大持续时间为185天。图3显示了人口统计学表中包含的三个评估分数的直方图,包括ACE-III基线、PHQ-9和GAD-7,以及它们按性别的分层。这些分数分别评估认知功能、抑郁和焦虑。该数据集还包括GDS-15分数,这是抑郁的另一种测量方法,其分布与PHQ-9相似。

技术验证

为了验证数据的技术质量,我们进行了几项分析:按性别和年龄组的子组比较、认知和心理健康评估分数与按性别分层的睡眠垫和智能手表信号之间的相关性分析,以及一组可视化以评估参与者信号轨迹的对齐情况。

图4a-c展示了按性别和年龄组比较每日步数、睡眠持续时间和平均心率的子组分析结果。箱线图显示,女性的平均心率(69.89 bpm ± 9.35)高于男性(65.91 bpm ± 7.49),而女性的每日步数(881.66步 ± 1266.85)低于男性(1167.70步 ± 1915.93)。女性的睡眠持续时间也略短于男性(415.34分钟 ± 35.27对比435.23分钟 ± 138.61)。这些模式与文献中先前的发现一致,报告了心率和活动水平等指标的性别生理差异。

图4还展示了不同年龄组中每日步数、平均心率和睡眠持续时间的分布。图4a显示,随着年龄增长,每日步数下降。最年轻的年龄组(72-75岁)显示出最高的中位数和最广泛的分布,而最老的组(88-99岁)具有最低的中位数和更集中的范围。这种模式支持先前的发现,即由于活动能力下降、能量水平降低和与年龄相关的健康状况,身体活动往往会随着年龄增长而下降。

图4b揭示了心率的类似年龄相关趋势。最年轻的组表现出最高的心率中位数,而最老的组记录最低的心率。这种下降可能与身体活动的减少相对应,并与先前研究表明在衰老过程中心率逐渐下降一致。相比之下,图4c显示,平均每日睡眠持续时间在不同年龄组中相对稳定,没有观察到实质性变化。

图5和图6展示了基线认知和心理健康评估与睡眠状态以及来自手表的生理信号之间的相关性热图,按性别分层。数据反映了在每次评估后七天期间计算的每日平均值和标准差。没有进行显著性测试或推断建模,这些分析旨在探索可能需要进一步调查的模式。

在男性中,我们观察到深度睡眠变异性增加与更高焦虑(GAD-7:r = 0.571)和抑郁分数(PHQ-9:r = 0.363)之间的中等到高度相关性。类似地,较低的ACE-III基线分数与REM(r = -0.527)和深度睡眠(r = -0.575)的更大变异性相关,与较短的REM持续时间(r = -0.499)相关。这些描述性发现与文献一致,表明睡眠稳定性与认知和心理健康之间存在联系。

在女性中,相关性通常较弱。值得注意的描述性关联包括REM变异性与焦虑(GAD-7:r = 0.218),REM持续时间与抑郁(GDS-15:r = 0.217),以及唤醒时间变异性与认知(ACE-III基线:r = -0.358)。这些性别差异可能反映了最初影响女性参与者的潜在生理或行为因素。

对于来自扫描手表的生理信号,我们发现,在女性中,较高的平均和最低心率与焦虑相关(GAD-7:r = 0.399和r = 0.242),在较小程度上与抑郁相关(PHQ-9:r = 0.128)。相比之下,在男性中,最大心率变异性显示与较高焦虑(GAD-7:r = 0.471)和抑郁(PHQ-9:r = 0.318)的中等相关性,与较低认知表现(ACE-III基线:r = -0.539)。这些模式与先前关于心率变异性和心理健康的心血管观察研究一致。

身体活动也与心理健康结果有描述性关联。较低且变化较小的步数与两性中较高的抑郁症状相关,与先前关于久坐行为和心理健康的发现一致。步数变异性与抑郁(GDS-15)之间的相关性在男性中(r = -0.533)比在女性中(r = -0.443)更强,尽管这些是没有统计测试的描述性模式。

图7a说明了一位认知功能完好且抑郁和焦虑风险较低的参与者,由基线时较高的ACE-III分数和较低的PHQ-9和GDS-15分数表示。该参与者随着时间的推移显示出相对一致的睡眠结构,浅睡和清醒持续时间最为突出。他们的步数轨迹也显示出规律的模式,身体活动减少的时期有时与清醒持续时间增加相吻合,表明活动和睡眠质量之间可能存在关系。在6个月随访时,通过ACE-III测量的认知表现略有下降,但仍保持在健康认知功能范围内。相比之下,图7b描述了一位认知功能受损且抑郁风险较高的参与者,由基线时较低的ACE-III分数和较高的PHQ-9和GDS-15分数表示。该参与者显示出更长的深度睡眠持续时间,步数与睡眠状态之间没有明显的相关性。在6个月随访时,ACE-III分数略有改善,但仍保持在认知下降的指示范围内,与深度睡眠持续时间增加、浅睡减少和身体活动减少一致。

使用说明

旨在推进临床相关的机器智能和决策支持系统,RESILIENT数据集结合了纵向数据与心理健康和认知功能评估,促进连续医疗监测。除了原始数据外,我们还开源了用于从智能设备收集数据的软件平台。我们还提供了全面的指南,用于访问、可视化和分析睡眠状态、身体活动和心理健康之间的相关性。

该数据集组织为一个所有参与者的人口统计学表和每个参与者的单独文件夹,包括作为单独逗号分隔值(CSV)文件存储的四个单独表:睡眠状态、睡眠生理、手表记录的步数和心率。数据可以在文件之间交叉引用。加载数据的说明和用于汇总和分析数据集的一组示例代码也在GitHub存储库中提供。

代码可用性

RESILIENT数据集可通过其专用的Zenodo存储库公开获取。为了支持可重复性和进一步探索,我们提供了两个互补的开源代码库:

  • 数据分析和可视化代码:包含用于生成所有汇总统计、图表和分层分析(例如,按性别和年龄组)的代码,包括详细描述数据记录结构的README文件和列出所有软件依赖项的"requirements.txt"文件
  • RESILIENT平台代码:提供用于收集、处理和管理家庭监测数据的完整RESILIENT平台的源代码,包括可穿戴数据获取工具、数据预处理、存储基础设施和报告生成工具

【全文结束】