VitalDB心律失常数据库:经麻醉医师验证的大规模术中心律失常数据集(含心跳与心律标签)v1.0.0VitalDB Arrhythmia Database: An Anesthesiologist-Validated Large-Scale Intraoperative Arrhythmia Dataset with Beat and Rhythm Labels v1.0.0

环球医讯 / 心脑血管来源:physionet.org韩国 - 英文2026-03-05 23:07:47 - 阅读时长10分钟 - 4975字
韩国研究团队发布VitalDB心律失常数据库,该数据集包含482例手术患者的734,528秒连续心电图数据,经五位麻醉医师验证超过66万个心跳分类,涵盖4种心跳类型和10类心律异常。数据库采用深度学习心跳分类器进行初步筛选,科恩卡帕系数达0.930,为术中环境特有心律失常研究提供首个大规模标注资源,支持通过VitalDB平台获取原始波形数据并开发多模态检测算法,对提升围手术期心律失常实时干预能力具有重要临床价值。
VitalDB心律失常数据库术中心律失常麻醉医师验证心电图心跳标注心律标签深度学习分类器围手术期公开数据集生理信号检测算法
VitalDB心律失常数据库:经麻醉医师验证的大规模术中心律失常数据集(含心跳与心律标签)v1.0.0

摘要

术中心脏心律失常与非手术环境相比具有独特特征和临床挑战,但现有公开心电图(ECG)数据库主要集中于门诊和重症监护环境。为填补这一空白,我们推出VitalDB心律失常数据库——一个经标注的术中心电图综合数据集,专为开发和验证手术环境中心律失常检测算法而设计。该数据库包含482例手术患者的734,528秒连续心电图数据,其中超过660,000个独立标注心跳被分为4种心跳类型和10类心律类别。为高效处理海量原始数据,我们开发了定制化深度学习心跳分类器,作为心律失常候选片段的自动化筛查工具。所有标注均经过五位麻醉医师的严格验证,每个片段至少由两位医师独立复核。评分者间信度分析显示高度一致性,科恩卡帕系数达0.930±0.130。这一公开资源为研究社区提供了经临床验证的术中心律失常数据,有助于开发适用于围手术期独特生理及技术挑战的稳健检测算法。

背景

术中阶段因手术刺激、麻醉药物和自主神经波动而呈现高发的心脏心律失常[1, 2]。尽管术中心律失常具有独特模式,现有公开心电图数据集主要来自门诊动态心电图记录,未能体现手术环境的特殊性。此类数据集的创建面临挑战,需经验丰富的麻醉医师手动复核数小时心电图记录。虽然多数围手术期心律失常属良性,但可能需紧急干预,延误治疗将增加发病率和死亡率。术中心电图标注心律失常数据集的匮乏阻碍了先进检测算法的开发。为此,我们分析了来自VitalDB(外科患者高保真多参数生命体征数据库)[3, 4]的734,528秒心电图数据,其心律和心跳标签经麻醉医师验证,现将VitalDB心律失常数据库作为公开数据集发布,以促进该特殊临床环境下的医学研究和算法开发。

方法

该数据库通过多阶段流程构建:首先自动筛查公开的VitalDB开放数据集[3, 4],随后由五位麻醉医师进行细致的人工标注和验证。

  1. 自动化候选筛查:采用深度学习心跳分类器UniMS-ECGNet高效识别潜在心律失常片段。该算法在VitalDB开放数据集、MIT-BIH心律失常数据库[3, 5]和CU室性心动过速数据库[3, 6]上训练。候选片段根据连续异常心跳、高R-R间期变异率或规律性异位搏动等标准筛选。模型架构和使用详情见参考代码库[7]。
  2. 标注与验证:单个心电图心跳被分为四类(正常、室上性、室性、无法分类)。每个连续片段被赋予十类最终心律标签之一。所有自动化筛选结果均经五位认证麻醉医师严格临床验证,每个片段至少由两位医师独立标注以达成最终共识。

数据描述

数据集包含元数据文件和482个独立标注文件。原始心电图波形数据未包含在此包中,但可通过对应case_id从公开VitalDB数据库免费获取[3, 4]。亦可通过VitalDB Python包(pip install vitaldb)编程访问波形数据,无需手动下载或额外认证。

  • metadata.csv:汇总所有病例的单一文件,包含case_idanalyzed_duration_sectotal_beats及病例中存在的rhythm_classes列表等字段,同时提供相关手术和临床信息。
  • Annotation_Files/文件夹:包含每个病例对应的CSV文件,提供详细的心跳和心律标注。标注文件按Annotation_file_[case_id].csv格式命名。

标注文件列定义如下:

  • time_second:R波峰值时间戳(秒),从记录起始点测量
  • beat_type:单个心跳的分类
  • rhythm_label:该心跳所在片段的整体心律标签
  • bad_signal_quality:布尔标记(真/假),指示心跳是否位于噪声过大或信号质量差的片段
  • bad_signal_quality_label:标注信号质量差片段的起始或结束(如Start1End1)。非边界行此列为空
心律与信号质量标注

心律类别 数据库包含10类心律,统计摘要如下:

心律标签 病例数 心跳数 持续时间(秒)
窦性心律 370 408,420 384,407
噪声 250 - 67,734
心房颤动 111 163,270 121,888
规律性室性异位搏动 109 24,069 47,481
室上性心动过速 109 6,416 14,799
室性心动过速 88 1,598 9,927
规律性房性异位搏动 85 20,326 40,600
窦房结功能障碍 66 23,141 31,942
游走性房性心律/多源性房性心律 26 10,132 9,630
房室传导阻滞 10 4,323 5,486
无法分类 6 199 631

信号质量标签 采用特定标准标注信号质量差的片段:

  • 信号质量差:QRS波群可见但噪声掩盖P波或T波形态,导致准确解读困难。当基础心律仍可识别时,此标签可与其他心律标签并用。
  • 噪声:伪影严重致QRS波群无法检测的片段。因此,标记为"噪声"的片段不含心跳级标注。

使用说明

数据访问与应用

VitalDB心律失常数据库为VitalDB(外科患者高保真多参数生命体征数据库)中的心电图波形提供专家医学标注,VitalDB亦在PhysioNet平台提供[3, 4]。

虽然本标注专用于心电图心律失常,用户可轻松将其与原始VitalDB项目的完整原始波形数据关联。这使研究者能将标注与同步生物信号(如光电容积脉搏波动脉血压波形)无缝整合,为新型多模态算法开发铺平道路。

GitHub仓库[8]中的UsageNote.ipynb Jupyter Notebook提供了合并及使用双数据集的详细可执行指南。推荐工作流程如下:

  1. 下载标注文件

从此PhysioNet项目下载标注文件

  1. 安装必要包

安装访问波形数据和处理标注所需的Python包

pip install vitaldb pandas numpy matplotlib

  1. 加载心电图波形与标注

使用case_id从VitalDB下载心电图波形并加载对应标注文件

import vitaldb

import pandas as pd

import numpy as np

示例case_id

case_id = 337

从VitalDB加载心电图波形(采样率500 Hz)

vals = vitaldb.load_case(case_id, ['SNUADC/ECG_II'], 1/500)

ecg_data = vals['SNUADC/ECG_II']

加载标注文件

annotation_file = f'Annotation_file_{case_id}.csv'

annotations = pd.read_csv(annotation_file)

显示标注结构

print(annotations.head())

提取特定列

time_seconds = annotations['time_second'].values

beat_types = annotations['beat_type'].values

rhythm_labels = annotations['rhythm_label'].values

signal_quality = annotations['bad_signal_quality'].values

示例:获取特定时间段标注(如100-110秒)

start_time = 100

end_time = 110

segment_annotations = annotations[

(annotations['time_second'] >= start_time) &

(annotations['time_second'] <= end_time)

]

print(f"

{start_time}秒至{end_time}秒间的标注:")

print(segment_annotations[['time_second', 'beat_type', 'rhythm_label']])

示例:按特定心律类型筛选

afib_beats = annotations[annotations['rhythm_label'] == 'Atrial fibrillation']

print(f"

心房颤动总心跳数:{len(afib_beats)}")

  1. 整合分析

标注文件含带时间戳(time_second)的心跳级信息,可与心电图波形数据匹配用于可视化和分析。每个time_second值对应检测到的心跳R波峰值位置。

局限性

  • 标注范围聚焦:本数据集标注集中于经筛查流程识别的心律失常候选片段(每例约20分钟),最终由麻醉医师标注,而非覆盖全麻时长。因此,数据集不代表整个手术过程中每心跳的连续完整记录。
  • 数据整合:为提高分发效率,本包明确包含专家标注和元数据,设计为与VitalDB[3, 4]协同运行,其中对应高保真原始心电图波形可直接获取分析。

发布说明

此为VitalDB心律失常数据库的初始发布版本(1.0.0)。

伦理说明

本项目使用VitalDB——首尔国立大学医院批准的公开去标识化外科患者生命体征数据库(机构审查委员会编号H-1408-101-605)。由于本工作涉及公开可获取的去标识化数据的二次分析,无需额外伦理审批。

所有共享文件完全去标识化,不含受保护健康信息(PHI)。为确保隐私,数据、元数据及文件名中均无绝对日期或时间戳,所有时间信息均以相对时间偏移量提供。

利益冲突

作者声明无利益冲突。

参考文献

  1. Kwon CH, Kim SH. Intraoperative management of critical arrhythmia. Korean J Anesthesiol. 2017;70(2):120-6.
  2. Staikou C, Stamelos M, Stavroulakis E. Impact of anaesthetic drugs and adjuvants on ECG markers of torsadogenicity. Br J Anaesth. 2014;112(2):217-30.
  3. Goldberger AL, Amaral LA, Glass L, et al. PhysioBank, PhysioToolkit, and PhysioNet: components of a new research resource for complex physiologic signals. Circulation. 2000;101(23):e215-20.
  4. Lee HC, Park Y, Yoon SB, et al. VitalDB, a high-fidelity multi-parameter vital signs database in surgical patients. Sci Data. 2022;9(1):279.
  5. Moody GB, Mark RG. The impact of the MIT-BIH Arrhythmia Database. IEEE Eng Med Biol Mag. 2001;20(3):45-50.
  6. Nolle FM, Badura FK, Catlett JM, et al. CREI-GARD, a new concept in computerized arrhythmia monitoring systems. Comput Cardiol. 1986;13:515-8.
  7. VitalDB. Vital beat noise detection [Internet]. GitHub; 2025 [cited 2026 Jan 24].
  8. VitalDB. arrdb. GitHub [Internet]. [cited 2026 Jan 24].

【全文结束】