摘要
动态心电图(ECG)技术的发展产生了海量数据,目前需要人工技术人员解读。本研究测试了用于动态心电图直接向医生报告的人工智能(AI)算法。对14,606份动态心电图记录(平均持续时间14±10天)进行节拍级注释,由167名认证ECG技术人员与名为DeepRhythmAI的集成AI模型共同完成。随机选取5,235个AI或技术人员识别的节律事件(其中2,236个为关键心律失常事件)作为样本,由17个心脏病学家专家组进行注释。AI模型识别关键心律失常的平均灵敏度为98.6%(95%置信区间=97.7-99.4),相比之下技术人员为80.3%(77.3-83.3%)。每千名患者中AI模型的假阴性发现为3.2例,技术人员为44.3例。因此,技术人员漏诊风险的相对风险为AI模型的14.1倍(95%置信区间=10.4-19.0)。然而AI模型的假阳性事件率较高(12例/千人天,四分位距6-74),技术人员为5例/千人天(四分位距2-153)。结论表明,DeepRhythmAI模型对关键心律失常具有出色的阴性预测值,显著减少假阴性发现,代价是假阳性略有增加。仅使用AI分析可能降低医疗成本,改善需要动态心电图监测患者的诊疗效果。
引言
近年来,动态心电图技术快速发展使监测使用率大幅提升。同时,检测短暂、偶发心律失常(特别是心房颤动)的重要性日益显现。延长ECG记录时长和频率能提高心律失常检出率,对于晕厥患者和需要通过筛查心房颤动预防新发或复发性卒中的群体,指南建议进行延长监测。受益于低成本设备的普及、长期监测能力的提升及直接面向消费者设备的出现,心律监测数据呈爆炸式增长。全球医疗人员短缺使技术人员工作负担加重,可能降低心律注释质量,导致误诊、治疗延误和不良预后。
人工智能在乳腺X光片解读中已证实可替代第二名医生阅读者,在病理学中AI工具可提升病理学家准确度和效率。最近研究表明,基于AI的ECG模型能降低住院患者的死亡率。本研究设计了DRAI MARTINI试验,测试DeepRhythmAI模型用于动态心电图直接向医生报告的效能。主要目标是比较AI模型与技术人员分析动态心电图数据的表现,包括关键心律失常的假阴性和假阳性率。
结果
研究人群包含14,606例患者(平均年龄65.5±10岁,42.8%为男性),平均监测14±10天。最常见的监测指征为心悸、晕厥、头晕和心房颤动筛查。
关键心律失常
在关键心律失常(≥30秒心房颤动、≥30秒室上性心动过速、持续≥3.5秒的窦性停搏/心室停搏、任何持续时间的三度房室传导阻滞、≥10秒室性心动过速≥120次/分)的检测中,AI模型灵敏度显著优于技术人员(98.6% vs 80.3%)。每千名患者中AI的假阴性为3.2例,技术人员为44.3例,漏诊相对风险高14.1倍。AI模型的阴性预测值达99.9%,技术人员为99.1%。AI对所有单个关键心律失常类别的阴性预测值均更优。尽管AI检测的室性停搏、三度房室传导阻滞和≥10秒室性心动过速假阳性更多,但假阳性率(12例/千人天)仍低于临床可接受阈值。
非关键心律失常
非关键心律失常包括早搏、二度房室传导阻滞、2.0-3.5秒停搏、<10秒室性心动过速、加速性室性自主心律、≤30秒室上性心动过速和异位房性心律。AI模型在所有非关键心律失常中灵敏度更优,但特异性较低(除<30秒室上性心动过速和异位房性心律外)。
讨论
本研究证明DeepRhythmAI模型可安全替代技术人员解读动态心电图记录,关键心律失常灵敏度达98.6%,假阳性仅增加2.4倍。与技术人员相比,AI使漏诊患者数减少17倍,假阳性每6份记录增加1次(技术人员每14份增加1次)。考虑到AI表现超过指南推荐的单次高敏肌钙蛋白排除重大心血管事件的99%阴性预测值和70%阳性预测值基准,我们认为AI单独分析动态心电图数据安全可靠。
本研究在方法上与既往心律失常分类AI研究存在根本差异:我们评估了AI作为唯一读者对大部分健康数据的解读,医生仅确认AI模型选择的事件。这种设计对管理日益增长的ECG数据量至关重要。本研究注释条带样本量是既往研究的6-16倍,首次报告了AI单独分析的阴性预测值、绝对假阳性和假阴性率。这些数据对于确定AI直接向医生报告的安全性至关重要,而这是既往研究未涉及的。直接向医生报告动态心电图结果可缓解医疗资源紧张,促进公平的检测和后续诊疗。
研究设计需考虑若干局限性:技术人员有临床信息而专家组和AI模型无此信息,专家组在研究协议下进行分析而非临床工作流程。我们未区分二度房室传导阻滞类型1和2,也未按监测指征报告亚组。监测指征通过设备输入,未报告指征不等同于缺乏该指征。假阴性事件定义为某方法在整段记录中未检测到该心律失常,但另一方法检测到。虽然我们考虑这是稳健的假阴性估计,但可能有两方法均未检测到的心律失常,这会降低两者的灵敏度和阴性预测值,但不会影响AI优于技术人员的结论。
方法
数据来源
数据来自2016-2019年间美国14,606名接受临床监测的患者,记录时长1-31天。使用PocketECG设备(双通道肢体导联II和III,采样率300Hz)采集211,010天的动态监测数据。患者由1,079名医生来自166家诊所转诊,在独立诊断测试设施由167名认证ECG技术人员使用特征基础算法进行节拍级分析。
DeepRhythmAI模型
DeepRhythmAI模型(v3.1)是用于心律分类的专有混合网络集成。包含卷积神经网络和Transformer架构组件,主要网络组件在1,716,141条5分钟ECG条带和60,549条≤30秒ECG条带预训练,内部验证使用15,188条≤30秒条带。算法流程图见扩展数据图5。
心律失常定义
关键心律失常包括≥30秒心房颤动、≥30秒室上性心动过速、持续≥3.5秒的窦性停搏/心室停搏、三度房室传导阻滞及≥10秒室性心动过速≥120次/分。非关键心律失常包括早搏、二度房室传导阻滞、2-3.5秒停搏、<10秒室性心动过速等。
【全文结束】