摘要
术中心脏心律失常与非手术环境相比具有独特特征和临床挑战,但现有公开心电图(ECG)数据库主要集中于门诊和重症监护环境。为填补这一空白,我们推出VitalDB心律失常数据库——一个经标注的术中心电图综合数据集,专为开发和验证手术环境中心律失常检测算法而设计。该数据库包含482例手术患者的734,528秒连续心电图数据,其中超过660,000个独立标注心跳被分为4种心跳类型和10类心律类别。为高效处理海量原始数据,我们开发了定制化深度学习心跳分类器,作为心律失常候选片段的自动化筛查工具。所有标注均经过五位麻醉医师的严格验证,每个片段至少由两位医师独立复核。评分者间信度分析显示高度一致性,科恩卡帕系数达0.930±0.130。这一公开资源为研究社区提供了经临床验证的术中心律失常数据,有助于开发适用于围手术期独特生理及技术挑战的稳健检测算法。
背景
术中阶段因手术刺激、麻醉药物和自主神经波动而呈现高发的心脏心律失常[1, 2]。尽管术中心律失常具有独特模式,现有公开心电图数据集主要来自门诊动态心电图记录,未能体现手术环境的特殊性。此类数据集的创建面临挑战,需经验丰富的麻醉医师手动复核数小时心电图记录。虽然多数围手术期心律失常属良性,但可能需紧急干预,延误治疗将增加发病率和死亡率。术中心电图标注心律失常数据集的匮乏阻碍了先进检测算法的开发。为此,我们分析了来自VitalDB(外科患者高保真多参数生命体征数据库)[3, 4]的734,528秒心电图数据,其心律和心跳标签经麻醉医师验证,现将VitalDB心律失常数据库作为公开数据集发布,以促进该特殊临床环境下的医学研究和算法开发。
方法
该数据库通过多阶段流程构建:首先自动筛查公开的VitalDB开放数据集[3, 4],随后由五位麻醉医师进行细致的人工标注和验证。
- 自动化候选筛查:采用深度学习心跳分类器UniMS-ECGNet高效识别潜在心律失常片段。该算法在VitalDB开放数据集、MIT-BIH心律失常数据库[3, 5]和CU室性心动过速数据库[3, 6]上训练。候选片段根据连续异常心跳、高R-R间期变异率或规律性异位搏动等标准筛选。模型架构和使用详情见参考代码库[7]。
- 标注与验证:单个心电图心跳被分为四类(正常、室上性、室性、无法分类)。每个连续片段被赋予十类最终心律标签之一。所有自动化筛选结果均经五位认证麻醉医师严格临床验证,每个片段至少由两位医师独立标注以达成最终共识。
数据描述
数据集包含元数据文件和482个独立标注文件。原始心电图波形数据未包含在此包中,但可通过对应case_id从公开VitalDB数据库免费获取[3, 4]。亦可通过VitalDB Python包(pip install vitaldb)编程访问波形数据,无需手动下载或额外认证。
metadata.csv:汇总所有病例的单一文件,包含case_id、analyzed_duration_sec、total_beats及病例中存在的rhythm_classes列表等字段,同时提供相关手术和临床信息。Annotation_Files/文件夹:包含每个病例对应的CSV文件,提供详细的心跳和心律标注。标注文件按Annotation_file_[case_id].csv格式命名。
标注文件列定义如下:
time_second:R波峰值时间戳(秒),从记录起始点测量beat_type:单个心跳的分类rhythm_label:该心跳所在片段的整体心律标签bad_signal_quality:布尔标记(真/假),指示心跳是否位于噪声过大或信号质量差的片段bad_signal_quality_label:标注信号质量差片段的起始或结束(如Start1、End1)。非边界行此列为空
心律类别 数据库包含10类心律,统计摘要如下:
| 心律标签 | 病例数 | 心跳数 | 持续时间(秒) |
|---|---|---|---|
| 窦性心律 | 370 | 408,420 | 384,407 |
| 噪声 | 250 | - | 67,734 |
| 心房颤动 | 111 | 163,270 | 121,888 |
| 规律性室性异位搏动 | 109 | 24,069 | 47,481 |
| 室上性心动过速 | 109 | 6,416 | 14,799 |
| 室性心动过速 | 88 | 1,598 | 9,927 |
| 规律性房性异位搏动 | 85 | 20,326 | 40,600 |
| 窦房结功能障碍 | 66 | 23,141 | 31,942 |
| 游走性房性心律/多源性房性心律 | 26 | 10,132 | 9,630 |
| 房室传导阻滞 | 10 | 4,323 | 5,486 |
| 无法分类 | 6 | 199 | 631 |
信号质量标签 采用特定标准标注信号质量差的片段:
信号质量差:QRS波群可见但噪声掩盖P波或T波形态,导致准确解读困难。当基础心律仍可识别时,此标签可与其他心律标签并用。噪声:伪影严重致QRS波群无法检测的片段。因此,标记为"噪声"的片段不含心跳级标注。
使用说明
数据访问与应用
VitalDB心律失常数据库为VitalDB(外科患者高保真多参数生命体征数据库)中的心电图波形提供专家医学标注,VitalDB亦在PhysioNet平台提供[3, 4]。
虽然本标注专用于心电图心律失常,用户可轻松将其与原始VitalDB项目的完整原始波形数据关联。这使研究者能将标注与同步生物信号(如光电容积脉搏波和动脉血压波形)无缝整合,为新型多模态算法开发铺平道路。
GitHub仓库[8]中的UsageNote.ipynb Jupyter Notebook提供了合并及使用双数据集的详细可执行指南。推荐工作流程如下:
- 下载标注文件
从此PhysioNet项目下载标注文件
- 安装必要包
安装访问波形数据和处理标注所需的Python包
pip install vitaldb pandas numpy matplotlib
- 加载心电图波形与标注
使用case_id从VitalDB下载心电图波形并加载对应标注文件
import vitaldb
import pandas as pd
import numpy as np
示例case_id
case_id = 337
从VitalDB加载心电图波形(采样率500 Hz)
vals = vitaldb.load_case(case_id, ['SNUADC/ECG_II'], 1/500)
ecg_data = vals['SNUADC/ECG_II']
加载标注文件
annotation_file = f'Annotation_file_{case_id}.csv'
annotations = pd.read_csv(annotation_file)
显示标注结构
print(annotations.head())
提取特定列
time_seconds = annotations['time_second'].values
beat_types = annotations['beat_type'].values
rhythm_labels = annotations['rhythm_label'].values
signal_quality = annotations['bad_signal_quality'].values
示例:获取特定时间段标注(如100-110秒)
start_time = 100
end_time = 110
segment_annotations = annotations[
(annotations['time_second'] >= start_time) &
(annotations['time_second'] <= end_time)
]
print(f"
{start_time}秒至{end_time}秒间的标注:")
print(segment_annotations[['time_second', 'beat_type', 'rhythm_label']])
示例:按特定心律类型筛选
afib_beats = annotations[annotations['rhythm_label'] == 'Atrial fibrillation']
print(f"
心房颤动总心跳数:{len(afib_beats)}")
- 整合分析
标注文件含带时间戳(time_second)的心跳级信息,可与心电图波形数据匹配用于可视化和分析。每个time_second值对应检测到的心跳R波峰值位置。
局限性
- 标注范围聚焦:本数据集标注集中于经筛查流程识别的心律失常候选片段(每例约20分钟),最终由麻醉医师标注,而非覆盖全麻时长。因此,数据集不代表整个手术过程中每心跳的连续完整记录。
- 数据整合:为提高分发效率,本包明确包含专家标注和元数据,设计为与VitalDB[3, 4]协同运行,其中对应高保真原始心电图波形可直接获取分析。
发布说明
此为VitalDB心律失常数据库的初始发布版本(1.0.0)。
伦理说明
本项目使用VitalDB——首尔国立大学医院批准的公开去标识化外科患者生命体征数据库(机构审查委员会编号H-1408-101-605)。由于本工作涉及公开可获取的去标识化数据的二次分析,无需额外伦理审批。
所有共享文件完全去标识化,不含受保护健康信息(PHI)。为确保隐私,数据、元数据及文件名中均无绝对日期或时间戳,所有时间信息均以相对时间偏移量提供。
利益冲突
作者声明无利益冲突。
参考文献
- Kwon CH, Kim SH. Intraoperative management of critical arrhythmia. Korean J Anesthesiol. 2017;70(2):120-6.
- Staikou C, Stamelos M, Stavroulakis E. Impact of anaesthetic drugs and adjuvants on ECG markers of torsadogenicity. Br J Anaesth. 2014;112(2):217-30.
- Goldberger AL, Amaral LA, Glass L, et al. PhysioBank, PhysioToolkit, and PhysioNet: components of a new research resource for complex physiologic signals. Circulation. 2000;101(23):e215-20.
- Lee HC, Park Y, Yoon SB, et al. VitalDB, a high-fidelity multi-parameter vital signs database in surgical patients. Sci Data. 2022;9(1):279.
- Moody GB, Mark RG. The impact of the MIT-BIH Arrhythmia Database. IEEE Eng Med Biol Mag. 2001;20(3):45-50.
- Nolle FM, Badura FK, Catlett JM, et al. CREI-GARD, a new concept in computerized arrhythmia monitoring systems. Comput Cardiol. 1986;13:515-8.
- VitalDB. Vital beat noise detection [Internet]. GitHub; 2025 [cited 2026 Jan 24].
- VitalDB. arrdb. GitHub [Internet]. [cited 2026 Jan 24].
【全文结束】

