AI听诊器检测严重心脏病优于全科医生AI stethoscope detects severe heart disease better than GPs

环球医讯 / AI与医疗健康来源:www.msn.com英国 - 英语2026-03-04 01:15:54 - 阅读时长4分钟 - 1982字
一项发表在《npj心血管健康》期刊的研究表明,新型AI听诊器系统通过超声心动图数据训练,能以近临床精度识别严重心脏瓣膜疾病,在直接对比中显著超越全科医生听诊能力。该系统基于1767名英国患者的真实临床数据,在检测严重主动脉瓣狭窄时敏感度达98%,严重二尖瓣反流达94%,对中度病变检测率亦高达89%,且性能一致性远超医生个体差异。这一低成本筛查工具通过捕捉人耳不可及的声学特征,有望解决初级医疗中因听诊敏感度低导致的漏诊问题,为老龄化社会的心脏"流行病"提供早期干预新路径,特别适用于超声心动图资源紧张的基层医疗场景,但需进一步在真实世界验证其普适性。
AI听诊器心脏瓣膜疾病超声心动图全科医生早期检测严重心脏病筛查敏感度特异度机器学习
AI听诊器检测严重心脏病优于全科医生

一种新型AI驱动的听诊器系统通过超声心动图数据训练,正在改写心脏瓣膜疾病早期检测的规则,能够以近临床精度识别严重病例,且在直接对比中超越全科医生的听诊能力。

在《npj心血管健康》(自然出版集团)发表的一项研究中,研究人员介绍了一种人工智能系统,该系统可直接从听诊器录音中检测心脏瓣膜疾病(VHD)。该模型并非仅从心脏杂音学习,而是使用经超声心动图确认的标签进行训练。在1767名患者测试中,神经网络达到83%的准确率,性能超过全科医生(GPs),对严重瓣膜疾病的检测敏感度超过94%,为低成本、大规模筛查提供了可行路径。

背景

心脏瓣膜疾病常被描述为“下一个心脏流行病”,在老龄化人群中日益凸显,是心力衰竭的主要诱因。超过半数病例未被诊断,主要因早期症状类似正常衰老或体能下降。这种转诊延迟往往导致手术效果恶化。尽管超声心动图是诊断金标准,但其资源消耗过大,无法用于广泛筛查。初级医疗则依赖全科医生听诊,但敏感度有限。早期AI工具仅聚焦杂音检测,因使用未经超声心动图直接验证的小型数据集而限制了准确性。

为弥合这些差距,本研究引入了基于大型多样化队列超声心动图标记数据训练的神经网络。通过学习超越人耳可听杂音的细微声学标记,该算法旨在支持更早、更可靠的VHD检测。

研究设计与方法

研究人员开发了一种利用电子听诊器录音结合超声心动图参考诊断来检测VHD的AI系统。数据来自英国三项研究的1767名患者,包括两个接受常规超声心动图检查的医院队列和基于社区的OxVALVE研究。排除标准包括既往瓣膜手术、妊娠和严重心力衰竭。

心脏声音在四个标准听诊位点(主动脉瓣、肺动脉瓣、三尖瓣和二尖瓣)使用电子听诊器记录,时长最长15秒,环境包含真实临床背景噪音。所有参与者均接受正式超声心动图检查,瓣膜严重程度按英国超声心动图学会指南分级。

该算法基于赢得PhysioNet挑战赛的框架构建,采用带迁移学习的循环神经网络。它首先在公开杂音录音上预训练,再使用超声心动图标记数据集微调。为每个听诊位点创建独立模型,最终分类由跨位点最高预测概率决定。作为对比,14名全科医生通过在线平台审查相同录音(仅显示患者性别),预测临床显著VHD。统计评估包括麦克尼马尔检验和自助法。

算法性能与对比评估

最终数据集包含6479条录音,涵盖1767名患者(48%女性,中位年龄74岁)超过25小时的音频。其中1504名患者用于训练,263名用于独立测试集。临床显著VHD(≥轻度狭窄或中度反流)存在于793名患者(45%),主动脉瓣狭窄(AS)和二尖瓣反流(MR)是最常见病变。

AI系统在检测临床显著VHD时达到0.83的AUROC值。在预设操作阈值下,敏感度为72%,特异度为82%,校准性能强(预期校准误差0.08)。严重疾病检测表现突出:严重AS敏感度98%,严重MR达94%。中度AS检测敏感度较高(89%),而中度MR检测较温和(测试中75%,交叉验证中50%)。位点级分析显示三尖瓣位置对整体性能贡献最大,但结合主动脉瓣和二尖瓣位点带来最广泛效益。

与听取相同录音的14名全科医生相比,该算法在敏感度和特异度上均具明显优势(分别为72% vs 62% 和 82% vs 64%)。它在尤登指数上优于14名医生中的13名,且性能比临床医生间显著波动更为一致。

洞察与讨论

本工作证明,机器学习能够利用短时、非侵入性听诊器录音准确检测临床显著VHD,依托迄今最大规模的经超声心动图确认的心音图数据集。直接基于超声标签训练使模型能识别超越人类感知的声学线索,促使其在严重AS和MR中表现优异。

尽管与全科医生的对比受限于耳机式远程听诊,但仍突显了AI如何在诊断资源有限的环境中补充传统听诊。由于数据集特意纳入更高比例的医院患者以确保临床显著病例数量充足,实际世界患病率会更低,这可能影响预测值和敏感度。更大规模的初级医疗研究对确认常规实践中的普适性至关重要。

结论

本研究展示了一种AI系统,能以近临床精度从电子听诊器录音中检测临床显著VHD。通过基于超声心动图标签(而非杂音标注)训练,该模型识别出超越人耳的声学特征,对严重主动脉瓣狭窄检测敏感度达98%,严重二尖瓣反流达94%,且性能优于全科医生听诊。

尽管对反流性病变(如主动脉瓣反流和三尖瓣反流)的检测较低,该系统提供了快速、低成本、可扩展的筛查选项,可支持更早诊断和更及时转诊,尤其适用于资源紧张的初级医疗环境。进一步的真实世界验证必不可少,但此方法在有限超声心动图能力与传统听诊低敏感度之间架设了实用桥梁。

期刊参考文献

麦克唐纳等(2026)。基于多中心研究开发与验证AI增强听诊用于心脏瓣膜疾病筛查。《npj心血管健康》,3(1),5-。DOI:10.1038/s44325-026-00103-y。

【全文结束】