摘要
生成反事实可解释人工智能(XAI)为理解AI模型如何解读心电图(ECG)提供了一种新方法。传统解释方法侧重于突出重要的ECG片段,但通常无法阐明这些片段为何重要或其改变如何影响模型预测。相比之下,所提出的框架探索了“如果...会怎样”的情景,生成能够增加或减少模型预测值的反事实ECG。这种方法可以提高临床医生对特定变化(如T波振幅增加或PR间期延长)影响模型决策的信任。通过一系列验证实验,该框架展示了生成符合既定临床知识的反事实ECG的能力,包括与钾失衡和房颤相关的特征性变化。通过清晰地展示ECG形态和节律的逐步修改如何影响AI-ECG预测,这种生成反事实方法超越了静态归因图,并有可能提高临床医生对AI-ECG系统的信任度。
引言
应用于心电图(AI-ECG)的人工智能(AI)在诊断和预测心血管及其他系统性疾病方面表现出卓越的能力,常与心脏病专家的专业水平相当甚至超越。尽管取得了这些成就,基于深度学习的AI-ECG模型面临一个关键挑战:其决策过程不透明,通常被视为“黑箱”。这些局限性是临床医生关注的重大问题,他们依赖于理解AI决策来有效信任并使用这些技术进行患者护理。因此,在解释AI决策中,可解释人工智能(XAI)的作用变得越来越重要。XAI旨在开发和完善不仅有效且对临床使用可解释和可靠的AI系统。在此背景下,“可解释”指能够理解AI为何产生特定结果,而“可靠”则涉及模型输出是否与临床知识一致。
方法
GCX框架定义
GCX框架是一个使用GCX解释AI-ECG模型预测的结构化过程(图1b)。它由两个阶段组成。首先,GCX方法用于从原始ECG生成两种类型的反事实ECG:正向和负向CF ECG。正向CF ECG是原始版本的修改版,能产生更高的AI-ECG模型预测值,而负向CF ECG则产生较低的预测值。例如,在T波振幅回归AI-ECG模型中,如果原始ECG的预测值为0.3毫伏(mV),GCX将生成正值或负值分别高于或低于0.3 mV的正向和负向CF ECG。其次,从原始和CF ECG中提取ECG特征并进行统计分析。此过程提供了在群体水平上特定ECG特征如何贡献于模型预测正向或负向变化的系统总结。
图1
研究流程概述。(a)为了评估生成反事实XAI(GCX)的有效性和实用性,我们构建了八个AI-ECG,并试图使用GCX对其进行解释。六个ECG特征回归模型通过GCX进行解释,以验证GCX是否能够识别和解释ECG的核心组件。此外,我们还使用GCX解释钾水平回归和房颤分类模型。(b)GCX生成反映特定AI-ECG模型预测输出变化的修改后ECG,无论是增加还是减少。这种方法使我们能够评估GCX生成的ECG是否与与临床状态相关的理论ECG变化一致。*RR SD;RR间隔标准差。
结果
表1显示了用于开发AI-ECG模型的数据集的基线特征。PTB-XL数据集包含18,869名患者和21,799份ECG,其中55.36%为男性参与者。该数据集包含1,514份(6.95%)被分类为房颤的ECG,其余20,285份(93.05%)为非房颤。MIMIC IV数据集包括104,804名患者和238,262份ECG,其中49.06%为男性参与者。该数据集包括16,964份(7.12%)低钾血症(<3.5 mmol/L)和14,101份(5.92%)高钾血症(>5.5 mmol/L)的ECG。
表1 用于ECG数据集的基线特征:PTB-XL和MIMIC-IV。
在概念验证(POC)实验中,使用中间心跳可视化分析了ECG特征——包括P、R和T波振幅以及PR间隔。正向CF ECG显示P、R和T波振幅较原始ECG增加,而负向CF ECG显示振幅减少(图3)。PR间隔面板显示正向CF ECG PR间隔延长,而负向CF ECG PR间隔缩短(图2)。对于RR间隔和RR SD,正向CF ECG显示出更长的RR间隔和更高的变异性(RR SD),而负向CF ECG显示出更短的RR间隔和更低的变异性(图2)。
图2
每个AI-ECG模型的CF ECG可视化。该图展示了GCX生成反事实ECG(CF ECG)的能力,并突出了原始(黑色)、正向CF(红色)和负向CF(蓝色)ECG之间的形态差异。P、R和T波振幅和PR间隔面板显示中间心跳可视化,表明它们在每个AI-ECG预测中的重要性。RR间隔和RR SD面板是CF ECG的5秒ECG示例,而不是中间心跳可视化,因为节奏变化无法通过中间心跳显示。钾和房颤面板也使用中间心跳可视化来突出典型变化,如高钾水平下T波振幅增加和房颤情况下P波消失。
讨论
本研究旨在验证GCX框架用于解释AI-ECG模型,特别是在ECG特征回归、钾水平回归和房颤分类的背景中。通过利用生成的CF ECG,我们寻求增强AI驱动的ECG诊断的可解释性和临床适用性。虽然GCX在先前的研究中已部分应用于ECG,但据我们所知,这是首次严格评估专门为AI-ECG解释量身定制的结构化GCX框架的研究。
我们首先进行了概念验证实验,以评估GCX是否能够识别和修改六个代表性的ECG特征:P波振幅、R波振幅、T波振幅、PR间隔、RR间隔和RR SD。结果证实,GCX有效地以生理一致性方式识别和修改了这些特征。在此基础上,我们将GCX框架应用于两个临床任务:钾水平回归和房颤分类。GCX框架提供了与血液钾水平和房颤诊断相关ECG变化的既定临床知识一致的解释和发现。
在钾水平回归模型中,对应于较高钾值的正向CF ECG显示T波振幅增加,呈现尖峰形态,P波扁平化且PR间隔延长,QRS复合体增宽(图2、3、补充图1)。然而,其他已知的高钾血症相关ECG变化,如传导障碍或心动过缓,并未通过此框架观察到。指示较低钾水平的负向CF ECG显示T波振幅降低,P波振幅增加,PS斜率降低表示更强的ST段压低,QT间隔延长且T波和U波融合。这些发现与既定的ECG知识一致。
在房颤分类模型中,与较高房颤概率相关的正向CF ECG表现出标志性特征,如P波消失和“不规则的不规则”节律的出现。如图2、3和补充图2所示,GCX可视化不仅展示了P波的消失,还清楚地表明了R峰位置的细微但具有临床意义的变化,明确显示出房颤特有的节律不规则。相比之下,传统的基于归因的方法(如显著性图)主要突出静态特征——在这种情况下是P波——未能捕捉动态节律变化或逐搏形态变化。因此,GCX提供了ECG信号形态和节律相关变化的全面解释。
结论
总之,GCX框架通过提供与既定ECG知识一致的特定ECG特征、形态模式和节律变化的清晰直观解释,代表了AI-ECG模型可解释性和可靠性的有意义进步。通过生成和分析CF ECG,GCX有效地解决了传统XAI方法在ECG分析中的关键局限性,并在临床和技术应用方面具有重大前景。未来的研究应旨在将GCX的使用扩展到更广泛的临床任务和AI-ECG模型,以进一步验证其有效性和实用性。此外,评估其在不同人群和ECG数据集上的表现对于提高其通用性至关重要。
(全文结束)


