人工智能与心电图:心脏诊断与预防的新前沿Artificial Intelligence and ECG: A New Frontier in Cardiac Diagnostics and Prevention

环球医讯 / AI与医疗健康来源:www.mdpi.com波兰 - 英文2025-08-02 20:35:46 - 阅读时长27分钟 - 13484字
随着移动技术和人工智能(AI)在医疗领域的迅速发展,自动化心脏诊断系统已成为战略重点。本文综述了AI在智能手表等可穿戴设备获取的心电图(ECG)信号分析中的应用现状,并展望了未来临床应用的前景。研究表明,现代AI算法,尤其是深度神经网络,有望检测心律失常、心力衰竭、长QT综合征等心血管疾病。虽然智能手表在检测心房颤动(AF)方面表现出潜力,但仍需在多样化的现实环境中进一步验证。文章还探讨了创新趋势,如基因数据整合、数字孪生、联邦学习和本地信号处理,以及监管、技术和伦理挑战。人工智能显著提升了个性化、移动和预防性心脏病学的发展,其在智能手表心电图分析中的整合为心脏疾病的早期检测和人群规模筛查开辟了新路径。
人工智能心电图可穿戴设备智能手表心脏疾病心律失常心力衰竭长QT综合征心房颤动数字心脏病学临床应用可解释AI数据安全算法偏见
人工智能与心电图:心脏诊断与预防的新前沿

摘要

目标:随着移动技术和人工智能(AI)在医疗保健中的日益重要,自动化心脏诊断系统的发展已具有战略意义。这篇综述旨在总结AI在分析来自可穿戴设备(特别是智能手表)的心电图(ECG)信号方面的最新知识,并概述未来临床应用的前景。

方法:通过使用PubMed、Web of Science和Scopus数据库进行叙述性文献综述。搜索重点是与AI、ECG和可穿戴技术相关的关键词组合。筛选并应用纳入标准后,最终选取了152篇出版物进行最终分析。

结论:现代AI算法——尤其是深度神经网络——在检测心律失常、心力衰竭、长QT综合征和其他心血管疾病方面表现出希望。没有ECG传感器的智能手表,使用光电容积描记法(PPG)和机器学习,在人群层面初步筛查心房颤动(AF)方面具有潜力,尽管仍需在多样化的现实环境中进一步验证。本文探讨了创新趋势,如基因数据整合、数字孪生、联邦学习和本地信号处理。同时讨论了监管、技术和伦理挑战,以及临床证据有限的问题。人工智能显著提升了个性化、移动和预防性心脏病学的发展。它在智能手表ECG分析中的整合为心脏疾病早期检测和大规模人群筛查开辟了新路径。

关键词:人工智能;心电图;可穿戴设备;智能手表;心房颤动;数字心脏病学

1. 引言

随着移动技术和人工智能(AI)的快速发展,医疗保健正在进入一个新时代——由远程和自动化医疗服务定义的时代。根据世界卫生组织的数据,心血管疾病是全球死亡人数最多的疾病,正成为智能诊断系统(如远程心律监测和AI辅助心电图分析)优先部署的领域。早期发现心脏疾病显著改善了患者的预后和生活质量。

本文介绍了移动自动化心脏护理系统的应用,重点介绍了AI辅助智能手表。非侵入性获取生理信号——包括光电容积描记法(PPG)、心电图(ECG)、心音图(PCG)——以及基于人工智能和深度学习的分析,使得心血管异常和疾病的预测性诊断成为可能。同时,此类系统的成功实施不仅需要准确的算法,还需要其可解释性(可解释性AI)、临床实践的整合,以及在人群和系统层面的可用性评估。本文分析了当前的最新进展,并确定了这一快速发展的领域在实施中的挑战和未来研究与创新的可能方向。

2. 材料与方法

本文呈现了关于可穿戴设备中心电图分析中人工智能应用的叙述性文献综述。文献搜索的初始阶段使用了PubMed、Web of Science和Scopus数据库,关键词组合包括“smartwatch AND ECG AND artificial intelligence”和“smartwatch AND ECG AND AI”。这一阶段共获得了42和22条结果(PubMed)、31和18条结果(Web of Science)以及24和17条结果(Scopus)。共获得154篇出版物,去除重复后保留了69篇用于进一步分析。

在第二阶段,进行了扩展搜索,考虑了更广泛的相关主题标题,如“ECG AND artificial intelligence”、“smartwatch AND ECG”、“wearable AND ECG AND AI”、“digital health AND arrhythmia detection”、“artificial intelligence AND atrial fibrillation AND wearable”、“AI AND ECG-based diagnosis”和“deep learning AND ECG”。第二阶段的目标是扩大综述范围,以捕捉第一阶段未包括但与AI分析智能手表心电图信号相关的研究。

应用类似的纳入标准——主要是原始临床研究(前瞻性或回顾性)、荟萃分析、最近约5年内的英文出版物——并排除了与主题无关的论文后,最终选择了152篇出版物进行分析。图1展示了使用适应的PRISMA风格流程图的文献选择过程。

3. AI在ECG分析中的应用

人工智能在心脏病学中具有巨大潜力,尤其是在心电图分析方面。AI支持心电图结果的解释,特别是深度学习(DL)方法,如卷积神经网络(CNNs),可以有效诊断心脏病。这些模型通过减少心律失常的诊断时间和促进患者的日常监测,支持临床医生的工作,特别是在使用移动设备时。AI在心电图信号质量评估、伪影检测和自动拒绝受干扰的导联方面也有应用,这提高了分析的可靠性,尤其是在可穿戴设备和远程医疗中。表1总结了选定的机器学习和深度学习(ML/DL)方法及其在心脏诊断中的应用。

表1. 选定的机器学习和深度学习(ML/DL)方法及其在心脏诊断中的应用。缩写说明如下:ML(机器学习),DL(深度学习),AF(心房颤动),LAE(左心房扩大),NSTE-ACS(非ST段抬高急性冠状动脉综合征),MACE(主要不良心血管事件),HCM(肥厚型心肌病),VHD(瓣膜性心脏病),CHD(冠心病),HA(心脏骤停),CHF(充血性心力衰竭),AR(主动脉瓣反流)(作者自编)。

通常结合两种或更多AI架构以实现协同效应,例如将长短期记忆(LSTM)网络与卷积神经网络(CNNs)结合。

AI可以在不了解患者数据的情况下,仅基于经典12导联心电图,以类似传统临床因素的方式预测AF风险。然而,将AI与临床数据结合可以产生最准确的结果。尽管如此,AI可以作为快速自动筛查工具。即使心电图外观正常且为窦性心律,AI模型也能检测到AF的隐形痕迹,如P波变化或节律微波动。这为更早地发现疾病标志物开辟了潜在途径,尽管在常规临床实施之前仍需前瞻性验证。

人工智能正越来越多地进入心脏电生理学领域,远超表面心电图的分析。正如Cersosimo等人的综述所示,AI在分析心内电图、评估猝死(SCD)风险和规划消融手术中找到了应用。作者还展示了大型语言模型(如ChatGPT-4)如何支持临床医生解释复杂的电生理数据并将其转化为临床决策。相比之下,由欧洲心律协会(EHRA)、心律协会(HRS)和欧洲心脏病学会(ESC)发表的专家共识Svennberg等人确定了AI在电生理学中的三个主要应用领域:检测心律失常(包括亚临床心房颤动)、支持消融规划和预测治疗结果。重要的是,超过一半的研究表明,通过AI整合可以提高诊断准确性和治疗效果。结合心电图数据和心脏成像(如MRI或CT)的多模态方法也变得越来越重要。Tang等人的研究表明,这种混合模型可以更好地定位心律失常的来源,从而提高消融效果,特别是对于复杂的心律失常,如心房颤动或室性心动过速。积累的证据证实,AI不仅是辅助工具,而且正成为现代心脏电生理学的重要组成部分——支持诊断、治疗规划和治疗结果的监测,最终改善患者的预后。

几项最新研究证明了AI-ECG能够转化为切实的临床益处。在一项多中心随机试验中,Lin等人表明,AI生成的心电图警报促进了早期临床干预,导致全因死亡率降低了17%,心脏死亡率降低了93%。此外,在初级护理中的集群随机EAGLE试验(Yao等)中(n=22,641),AI-ECG的使用使低射血分数(≤50%)的早期诊断从1.6%提高到2.1%(OR 1.32,p=0.007),促进了心力衰竭的及时治疗。这些数据支持AI引导的心电图不仅精化了诊断,还改善了发病率和死亡率结果。适当的软件(如AccurBeat)进一步提高了数据的准确性和一致性,优于制造商的算法。Popat等人的一项系统综述表明,包括人工智能增强心电图(AI-ECG)和机器学习在内的AI模型比传统的风险评分(如CHADS-VASc、ARIC或CHARGER-AF)具有更好的敏感性和特异性。然而,研究之间在程序和数据一致性方面仍缺乏标准化。

例如,AI-ECG算法可以早期检测长QT综合征(QTc)——这对预防猝死至关重要——并能够分析P波、R波和T波交替,即心电图记录中特定波形振幅或形状的交替。后者通过卷积神经网络(CNNs)和改进的移动平均法(MMA)的结合得以实现。这使得心房颤动或猝死等风险的检测更快,风险分层更有效。心房颤动与中风风险相关。利用AI和机器学习分析心电图和生物标志物数据,可以帮助更好地预测中风风险并制定个性化治疗计划。此外,通过分析常规12导联心电图,AI能够预测患者是否可能射血分数降低,需要及时和有效的诊断,并且在确诊为射血分数降低心力衰竭的患者中,能够预测年度死亡率。在一项初步临床试验中,Viz HCM系统成功帮助医生识别新的肥厚型心肌病(HCM)病例,使近8%的符合条件患者能够迅速诊断和确认。人工智能或许可以帮助排除瓣膜性心脏病,但其低阳性预测值(PPV)意味着不能取代医生的最终诊断。AI还可以支持急诊科医生快速准确地检测心脏骤停。使用AI分析心电图可能代表诊断过程的一个有前景的发展,尽管还需要进一步的高质量证据来确认其临床等效性。此外,联合分析心电图和其他诊断测试(如脑电图(EEG))的可能性也显得有趣。在AI分析的背景下,迄今为止不相关的参数可能被证明是有效的诊断工具。近年来,联邦学习的发展使得在不进行数据传输的情况下,可以跨多个机构训练AI模型。这是在数据隐私和模型可推广性方面的重大进步。

4. 可穿戴设备与人工智能(AI)的结合应用

4.1 心房颤动(AF)的检测

得益于像FibriCheck这样的应用,仅使用PPG信号进行脉搏分析,没有原生ECG系统的流行智能手表和健身手环能够在半受控条件下高效检测心房颤动(AF)。这表明低成本和广泛可用的设备可以作为AF初步筛查的选项,但需进一步临床验证。

通过基本的机器学习技术进行运动伪影校正,无需广泛硬件改进,已经实现了脉搏信号质量的提升。或者,传统的PPG信号清理,例如使用小波滤波(DWT/IDWT),可以去除噪声,但在患者休息条件下才有效。

尽管智能手表模型的灵敏度很高,但特异性仍然不足。在Baca等人的综述中,决策树模型表现出最佳的整体性能,具有最佳的灵敏度、特异性和准确性平衡。

先进的PPG2ECGps模型采用卷积神经网络,允许从记录的PPG映射真实ECG的动态,从而实现更精确的心律失常诊断。这种方法仍需优化和验证,才能广泛应用于临床实践或智能手表的大规模使用。

此外,研究表明,基于PPG的智能手表可以准确测量每分钟的心率——尤其是在心率<110 bpm且患者活动较少的情况下。大规模的THOFAWATCH研究使用智能手表记录单导联心电图,没有AI支持。Huette等人表明,即使这种简单的方法也能在胸部手术后检测术后心房颤动(POAF)方面发挥作用。

单导联心电图使用AI辅助智能手表可以作为移动工具,例如记录患者在医生办公室外的心房颤动(AF)发作,但算法本身在解释结果方面证明不如医生。Badertscher等人基于Withings Scanwatch的研究表明了这一点。另一项由Mannhart等人进行的研究,使用深度神经网络(DNN)算法和五种不同的智能手表(Apple、Fitbit、AliveCor、Samsung、Withings)表明,人工智能可以显著减少不可读记录的数量并保持高准确性,使其成为医疗保健中的可行支持。DNNs如PulseAI显著减少模糊或不确定的结果,接近医生解释的准确性。Siamese网络是一个使用单通道心电图的个性化机器学习模型的例子。使用预先准备的心电图数据集(包含AF),基于少量特定患者的简短片段进行训练和微调,可以检测AF并以几乎最大效率进行,同时应对噪声。在Jaeger等人的文章中,对三种开源自动心电图划分算法(ECGdeli、ECGKit、NeuroKit)在两个经典数据库收集的数据上进行了比较。分析表明,Apple Watch数据具有更高的信号质量和更高的特征点检测灵敏度。ECGdeli算法证明是最稳定和多用途的,而NeuroKit提供了最高的时间测量准确性。机器学习(ML)和深度学习算法可以显著提高使用手表心电图检测心房心律失常的诊断准确性。深度神经网络(DNNs)比Apple应用更有效,可以成为心脏病诊断的工具,帮助临床医生做出更快和更精确的临床决策。与Holter心电图相比,Amazfit智能手表及其PPG算法和单导联心电图显示出非常好的灵敏度和与Holter评估心房颤动(即使持续时间>5分钟和<60分钟)的一致性。主要问题在于适度的特异性,即假警报的风险。CardioWatch 287-2设备则显示了接近100%的灵敏度和特异性,并检测到比传统Holter心电图更多的AF病例,这是由于更长时间的监测。这表明可穿戴设备在这一领域具有潜在的临床实用性,但需要在不同人群中进行更广泛的研究来确认这些发现。与植入式AF监测设备的比较表明,Apple Watch + KardiaBand + AI似乎是长期心脏节律监测的有前景的工具。

4.2 射血分数(EF)和心力衰竭(HF)的评估

此外,基于家庭心电图的AI可以相对准确地检测射血分数低(EF ≤ 40%)的心力衰竭。基于单导联,AI模型能够估计心力衰竭的风险。通过智能手表分析的每日心电图,AI可能在心力衰竭恶化的早期阶段检测到恶化,使医生能够更快地做出反应并减少再入院的风险。在他们的当前研究中,Lee等人使用AI分析简单的智能手表数据来控制出院后患者的状况。

4.3 QTc距离和电解质紊乱的评估

借助机器学习(ML),基于心电图信号的分析,可以准确监测并区分长QT综合征基因型。在终末期肾病(ESRD)患者中,定期监测血钾阳离子水平非常重要。AI可以从心电图的细微变化中估计K+离子水平。Cardio-Net允许连续、无创、实时监测钾,这可以预防死亡。

4.4 睡眠障碍和儿童心电图病理检测

初步证据表明,深度神经网络可以从单导联心电图数据中估计睡眠阶段,可能作为多导睡眠图的复杂测试的补充,尽管不能取代它们。Apple Watch和AI也可能作为儿童心律分析的医疗工具。2023年,开发了一种基于AI和单通道心电图的首个算法。该模型称为Xception_v8,在48名儿童中进行了测试,显示出高特异性(96.7%)和相对较低的灵敏性(66.7%)在检测病理性记录中的表现。进一步开发需要更多的儿科数据,并对研究组和对照组进行比较。

4.5 高级心电图信号重建和异步测量

此外,AI模型可以高效分析来自智能手表的异步心电图数据。因此,通过改变手表的位置并将其移动到身体的不同部位,可以测量3-4个心电图导联。例如,Apple Watch Series 4智能手表有两个电极——一个嵌入在手表外壳中,另一个是数字表冠,取代了触摸手指的按钮。用户通过改变手表和手指的位置进行三次测量。通过这种方式,可以重现经典心电图的I、II和III导联,测量质量和准确性与标准心电图相当。此外,增加另外六个心脏导联进一步提高了心电图分析和急性冠脉综合征(ACS)检测的可靠性。这显著提高了检测心肌梗死(MI)的机会,并开启了不限于单一导联的先进诊断智能手表应用的大门。

尽管AI模型可以从减少的输入数据中检测心脏疾病,但仅从两个导联中准确重建完整的12导联心电图仍然是一个挑战。在Presacan等人的研究中,AI生成的记录显示信号显著减弱,临床效用有限。有趣的是,另一个模型ECGT2T——尽管使用了来自智能手表的同样有限信号——能够生成人工10导联心电图记录,并以接近90%的灵敏度检测射血分数降低的心力衰竭(HFrEF)。这表明AI的效果不仅取决于经典心电图的精确重建,还取决于神经网络提取隐藏诊断模式的能力,即使不需要映射整个信号。概念验证研究表明,使用AI和单导联心电图进行早期高血压检测的可能性,尽管这种方法仍处于实验阶段,需要临床验证。然而,需要直接来自手表的数据来将这种方法付诸实践。

5. 大型语言模型(LLMs)在心脏病学中的应用

近年来(2024-2025年),大型语言模型(LLMs)如GPT-4V或专门的ECG-Chat在心血管医学中的应用迅速发展。越来越多的研究证实,它们在日常实践中作为医生的辅助工具(在诊断和文档记录方面)的潜力。多模态大型语言模型(MLLMs),如ECG-Chat,结合心电图信号数据与自然语言生成能力,能够自动生成心电图研究的结构化描述。这些工具可以在人员短缺或急诊部门工作量大的情况下提供有价值的帮助。

在评估ChatGPT-4V的研究中,该模型被证明能够视觉分析心电图波形并提供诊断问题的答案,支持临床医生的临床决策。重要的是,该系统不仅具备读取曲线的能力,还能够理解临床背景——例如,与患者的病史或用药有关。

此外,系统评价表明,LLMs在心脏病学中具有广泛的应用——从心电图分析到医疗记录总结,再到自动生成医院出院记录——尽管其有效性可能因临床背景而异。这些进展表明,LLMs有潜力显著改善临床工作流程:自动化报告生成、支持测试解释,并在床边提供临床决策支持工具的对话界面。随着这些技术的进一步发展,它们在日常医疗实践中的整合可以带来效率和护理安全性的实际益处。

6. 未来方向和创新概念

值得注意的是,一些用于心电图分析的AI模型,如梅奥诊所基于卷积神经网络(CNN)检测低射血分数的模型,已获得美国食品药品监督管理局(FDA)的批准,确认其已准备好在日常临床实践中实施。

将基因数据与心电图信号和其他生物参数整合正在引起越来越多的关注。与AF、HCM或长QT综合征相关的基因变异(例如单核苷酸多态性(SNPs))可以提供额外的诊断维度,结合心电图特征分析可以促进个性化风险分层模型的发展。从长远来看,这可以在临床表现出现之前,使无症状个体早期检测到心脏病的易感性。这一方法与精准医学的方向一致,可能成为心血管风险分层的新标准。图2显示了使用AI和ECG辅助智能手表的现代心脏护理流程图。

一个新的、快速发展的领域是AI辅助神经心脏病学,涉及心电图和脑电图信号的同步分析。初步研究表明,心率和大脑活动之间存在相关性。使用AI模型并行解释这些信号可能开辟新的诊断可能性,包括心律失常预测或癫痫诊断。图3展示了患者的“数字孪生”概念。

现代AI模型越来越多地整合心电信号(ECG)与成像数据,如超声心动图、MRI或CT,显著提高其临床实用性。一个例子是LVH-Fusion算法,结合ECG和超声心动图——表明多模态学习比单一模态分析能更好地检测左心室肥厚。另一项研究DEEP RISK使用12导联ECG与LGE-MRI图像和临床数据预测室性心律失常,实现了接收者操作特征曲线下面积(AUROC)为0.84——优于仅基于单一模态的模型。最近的文献综述强调了多模态AI在心脏病学中的快速增长潜力,尽管许多模型仍处于临床前研究阶段。通过结合功能性和结构性心脏数据,这些系统有更大的机会实现临床实施——例如,更好检测瓣膜性心脏病(VHD)、心肌病或猝死风险。我们建议未来的工作应集中在前瞻性试验中验证这些模型,并评估其对临床决策的影响。

最具前景的创新之一是患者“数字孪生”的概念。这种模型由ECG、PPG、HRV、睡眠和身体活动、临床信息等数据构建,可以通过AI持续更新。这创造了动态患者档案的可能性,可以在临床医生可见之前预测未来的临床事件。这可能增强监测、治疗和护理个性化的策略,但这些解决方案的可扩展性和临床影响仍有待证明。随着生物技术、AI和医疗保健之间的界限模糊,创建一个不仅检测疾病,还支持早期识别和预防的诊断生态系统成为现实机会。图3展示了患者的“数字孪生”概念。

AI模型基于ECG数据发展的未来方向之一是使用合成数据,即例如使用生成对抗网络(GANs)生成的数据。这使得即使在罕见疾病中,真实数据有限的情况下,也能创建现实的ECG或PPG信号。此外,使用迁移学习方法——即在大型数据集上预训练模型,然后为特定人群甚至个别患者进行微调——可以显著提高算法的效率和准确性。这些技术不仅克服了数据限制,还支持更个性化和防错的数字诊断的发展。

最近的进展还探索了可穿戴光子设备的使用,例如利用基于光的传感器同时评估心肺参数和生物识别的智能腕带。这些新兴技术超越了标准的ECG或PPG传感器,利用光学组件如光子芯片和近红外光谱捕捉微妙的生理信号。除了监测,它们还可以进行实时生物识别认证,这在确保数据安全和患者识别方面可能很有用。例如,Li等人提出的腕带采用全聚合物光子传感单元,实现呼吸频率、心率和血压的连续监测,并实现了98.6%的生物识别准确性。这些新系统可能补充传统的ECG或PPG方法,并代表非侵入性、连续性和个性化心血管诊断的新方向。

7. 与医疗系统的整合

将AI算法集成到临床实践中一个关键方面是其与现有医疗记录系统(EHRs)的整合。来自可穿戴设备的数据可以自动且安全地传输到全科医生使用的系统中。这种整合可以加快诊断速度,减少临床反应时间,并弥合消费者和医疗数据之间的差距。然而,需要适当的互操作性标准(例如,Fast Healthcare Interoperability Resources(FHIR)、Health Level Seven International(HL7))和法规合规性。为了使AI-ECG在日常临床工作中得到有效使用,需要与医院系统(EHRs)完全集成。为此,需要所谓的开放数据交换标准,其中最广泛使用的是FHIR(Fast Healthcare Interoperability Resources)。FHIR兼容的AI系统可以轻松与医院使用的各种软件接口。基于FHIR的AI框架在系统之间提供更好的互操作性,并实现AI-ECG与HER和外部应用的集成。例如,FHIR-AI平台在多中心部署中互操作性显著增加(从11%到66%)。AI模型还可以作为全科医生的助手,自动分析背景数据并仅生成相关的临床警报。该系统可以自动将患者转诊给医生的咨询或直接转诊给专家诊断,根据开发的临床算法。这种解决方案可以减轻初级保健医生的负担,减少从症状到诊断的时间,这可能显著改善治疗结果。

AI-ECG系统在医院实际应用中的主要问题之一是所谓的“警报疲劳”(alert fatigue)在医疗人员中。研究表明,决策支持系统中生成的90%以上的警报被医生忽略或关闭。这可能导致真正相关的信息被忽视。混合系统——警报最初发送给药剂师或护士,然后升级给医生,从而减少直接发送给医生的警报数量——可以是一个解决方案。AI-ECG不仅应分析ECG信号,还应现实地支持医生的临床决策。因此,它在CDSS系统内工作的必要性显得尤为重要,即提供在护理点(point of care)提供可操作建议的基于计算机的工具。AI-ECG可以生成护理点警报,即在医生做出决策时出现的警告——例如,在处方时。这种方法可以提高效率。

在公共卫生的背景下,智能手表因其持续监测参数的能力,可以作为主要预防工具,识别无症状AF或长QT综合征的个体,从而在并发症发生之前进行识别。例如,Apple Heart Study涉及超过400,000名参与者,旨在证明大规模心律失常检测的可行性,并能导致更早的医疗干预。

8. 挑战和当前限制

8.1 监管和数据安全

美国食品药品监督管理局(FDA)不将智能手表归类为医疗器械,这意味着它们不受传统医疗器械(如心电图监测设备)的同样严格要求。相反,智能手表被视为健康工具,在数字健康软件预认证(Pre-Cert)计划下批准更快,但不需要医疗器械的全面认证。

在欧盟,医疗器械法规(MDR,法规(EU)2017/745)将用于诊断目的的软件——包括AI驱动的心电图分析——归类为医疗器械。因此,这些系统必须经过符合性评估程序,获得CE标志,并进行上市后监测。此外,智能手表收集的数据属于《通用数据保护条例》(GDPR)的范围,强调合法处理、数据最小化、目的限制以及自动决策中解释权的要求。

除了MDR和GDPR带来的监管要求,基于AI的系统和可穿戴设备还引发了与数据隐私相关的重大伦理关注。敏感的生理数据——如心率、睡眠阶段或呼吸参数——由智能手表和健身手环被动收集,通常存储在商业云中,可能容易受到网络攻击、未经授权的访问或用户知情同意之外的第三方二次使用。此外,用户通常不清楚数据保留期、数据是否用于进一步的AI训练或与外部实体共享。根据欧洲法律,这些数据属于GDPR第4(15)条下的“健康数据”,要求数据最小化、透明管理、明确同意以及在原目的完成后删除数据的权利。这些问题需要明确的数据治理政策、明确的用户知情同意以及符合默认隐私和设计隐私原则的系统设计。实施匿名化、假名化、加密和例行安全审计在可穿戴健康技术的日常使用中至关重要。数据安全风险也是一个关注点。移动自动化心脏护理生态系统基于无线传感器网络,涉及个人设备(智能手表、智能手机)、云平台和外部分析系统。这些组件都必须得到充分保护。保护数据隐私和安全也是患者对现代数字医学信任的关键。这不仅需要适当的安全措施,还需要技术开发人员、医生和用户之间的透明合作。

8.2 技术限制

在可穿戴设备(如智能手表)中使用AI进行ECG分析的一个挑战是这些设备的计算能力和电池容量有限。传统的AI模型通常资源密集,使得它们在不将数据发送到外部服务器的情况下实时运行变得困难。针对这一问题,出现了如tinyHLS这样的开源软件包,允许将用Python编写的AI模型转换为节能硬件加速器,可以直接在设备上运行。这类解决方案有潜力突破目前的技术障碍,使AI在可穿戴设备中进行心律失常监测的使用更加广泛。tinyML工具也追求类似的目标,专注于在超低功耗微处理器(如智能手表和健身追踪器中的微处理器)上直接运行优化的机器学习模型。tinyML可以在不需要云的情况下,直接在设备上实时检测心律失常和其他ECG异常。

8.3 算法和质量的问题

要充分发挥AI在智能手表数据分析中的潜力,重要的是要有大量高质量和多样化的数据。所有AI模型都需要这些数据进行训练和验证。像TARGET这样的项目收集全面的多维健康数据,对开发个性化、准确的AI算法特别有价值。

还需要注意的是,目前流行的智能手表,如Apple Watch、Fitbit和Samsung Galaxy Watch,使用PPG和传统的启发式(SP)算法来检测AF。然而,这种光学技术存在几个限制,例如间歇性监测(例如,Apple每2小时仅分析1分钟(即不到一天的1%))和高拒绝率(通过运动伪影或手表佩戴不佳——高达30%的信号)。此外,研究具有高度选择性——通常分析已经是“阳性”的数据,因此不清楚有多少AF病例被遗漏。与这种模型相比,DNN可以忽略运动伪影并学习AF特定模式。DNN优于经典算法,允许几乎连续、无创的心律监测。

Siamese网络是一个AI模型的例子,基于深度学习,属于更广泛的机器学习类别。尽管它在检测AF方面非常有效,但它可能无法识别其他心律失常,不考虑身体姿势、运动和压力等背景数据,也不分析可能具有临床意义的非常短的AF发作。

与其使用传统的数据分段,不如从智能手表数据中单独为每个信号样本识别人类活动(HAR)(CEF),通过使用不同滤波器大小的卷积网络——多尺度卷积神经网络(MCNN)和智能特征加权(注意力)通道和时域,取代传统的固定时间窗口(SW)方法,显著提高了性能,特别是在ECG或运动传感器数据中。

8.4 偏见和通用性

用于训练AI模型的ECG数据通常来自人口统计学上同质的群体——例如,主要是白人男性,这可能导致女性和少数族裔个体的诊断性能下降。研究表明,解剖和节律差异(例如ECG信号形状)如果不考虑这种多样性,会影响AI算法的性能。例如,Noseworthy等人分析了一个检测低射血分数(EF ≤ 35%)的CNN模型,样本量接近100,000名不同种族的患者,发现曲线下面积(AUC)在所有组中均保持高位:非西班牙裔白人、亚洲人、黑人/非裔美国人、西班牙裔/拉丁裔和美洲原住民/阿拉斯加原住民。然而,另一项评估预测心力衰竭(HF)模型的研究表明,在年轻黑人女性中,AUC显著下降,表明模型性能在人口统计学依赖方面存在不均衡。因此,报告按性别、种族和年龄分列的模型有效性,测试单独的、人口统计学多样化的数据集,并实施公平意识学习或调整特定群体决策阈值等去偏技术至关重要。这些措施可以增加算法公平性并最小化加剧心脏护理中现有不平等的风险。

8.5 缺乏硬性临床证据

心电图是诊断中的许多元素之一。为了让临床医生信任AI的决策,他们需要了解决策的制定方式,以便将其与整体患者评估结合起来。AI算法——特别是深度学习模型——通常以“黑箱”方式运行——临床医生知道结果,但无法了解其背后的原因。可解释模型(如决策树或机器学习)被证明更容易理解。特定AI模型的选择应取决于问题、可用数据以及结果的可解释性是否重要。对于更复杂的模型,如分析ECG的神经网络,出现了更复杂的可解释AI(XAI)技术,使临床医生能够理解影响模型决策的因素。XAI技术提供了对算法内部运作的见解,这对临床信心和患者安全至关重要。XAI在临床接受中起着核心作用,因为临床医生不仅需要准确的预测,还需要了解模型做出某种决策的原因。XAI技术使深度学习模型更加透明和值得信赖。一个例子是所谓的显著性图,它可视化ECG信号中对检测病理学有重要意义的部分。另一个常用的方法是加权类激活映射(Grad-CAM),它可以可视化ECG信号中对模型决策影响最大的部分。在医学图像的背景下使用热图,而在ECG的情况下,指出决定分类的特定P波、QRS波或T波段。这对于心律失常检测特别有用,因为它可以评估模型是否关注临床相关特征,如RR间隔或P波和T波形态。另一个例子是SHAP值,它指出个别特征(如RR间隔、折射振幅)对预测结果的影响。SHapley Additive exPlanations(SHAP)是一种基于博弈论的技术,为每个特征对模型预测的贡献分配一个值。这可以确定哪些变量在诊断上最具意义。这种方法提高了模型的透明度,而不牺牲其预测能力,并可能在增加医生对AI算法的热衷方面发挥关键作用。尽管使用各种数字健康应用检测AF的总体结果有希望,但缺乏强有力的证据证明其使用能转化为更好的硬性临床结果(如并发症或死亡率的减少)。因此,需要进一步研究以确认其临床益处并促进这些工具在日常实践中的引入。

同时,正如2025年EHRA立场文件所示,许多电生理学中的AI研究未能满足基本报告标准,如数据描述、模型训练方法或临床试验记录。在分析的55篇论文中,没有一篇满足29点检查表中超过55%的要求。这意味着除了进一步的临床试验外,还需要提高已进行分析的方法质量和透明度。

8.6 可穿戴设备采用的差异

尽管可穿戴健康技术迅速扩展,但在不同人口群体中的采用仍存在显著差异。研究表明,智能手表的使用在年轻、收入和教育水平较高的个体中更为普遍。相反,老年人、社会经济地位较低的人、少数族裔以及居住在农村或数字服务不足地区的居民使用可穿戴设备的可能性要小得多。

这种差异对公平实施AI驱动的心血管诊断提出了挑战,可能会加剧已有的健康不平等。此外,有限的数字素养、成本障碍或对技术的不信任可能阻碍用户参与,降低这些系统的实际效果。

为确保公平访问并最大化公共健康效益,未来战略应优先考虑负担得起性、可及性和针对面临数字排斥风险人群的定向教育宣传活动。否则,基于可穿戴设备的诊断可能会无意中加剧差异,而非缓解它们。

9. 结论

移动技术和人工智能的发展显著改变了心脏护理方法,实现了远程、非侵入性和连续的心脏状况监测。智能手表在心律失常检测、心力衰竭风险预测、电解质紊乱评估和睡眠质量分析方面显示出越来越高的效果——在一些研究中,其性能接近传统临床方法,尽管准确性和验证策略的变异性仍是一个问题。然而,设备的技术限制、算法的低特异性以及标准化和整合到医疗系统中的需求仍然是一个挑战。尽管存在这些障碍,发展——如数字孪生、联邦学习、多模态分析(如ECG + EEG)、合成数据的使用和个性化AI模型——突显了这一领域的强劲发展前景。引入适当的监管、确保数据安全和跨学科合作是充分挖掘AI在日常心脏病学实践中的潜力的关键。

作者贡献

概念化,D.B.-A., K.R. 和 D.A.;方法论,D.B.-A., K.R. 和 D.A.;验证,D.B.-A., K.R. 和 D.A.;正式分析,D.B.-A., K.R. 和 D.A.;资源,D.B.-A., K.R. 和 D.A.;写作——初稿准备,D.B.-A., K.R. 和 D.A.;写作——审查和编辑,D.B.-A., K.R. 和 D.A.;可视化,D.B.-A., K.R. 和 D.A.;监督,D.B.-A., K.R. 和 D.A. 所有作者已阅读并同意发表的版本。

资金

本研究未获得外部资金支持。

机构审查委员会声明

不适用。

知情同意声明

不适用。

数据可用性声明

不适用。

利益冲突

作者声明无利益冲突。

【全文结束】

大健康
大健康