基于特征选择和贝叶斯优化支持向量机的冠状动脉疾病预测Frontiers | Coronary Artery Disease Prediction using Bayesian-Optimized Support Vector Machine with Feature Selection

环球医讯 / 心脑血管来源:www.frontiersin.org保加利亚 - 英语2026-01-10 18:22:48 - 阅读时长2分钟 - 661字
本研究提出一种非侵入性冠状动脉疾病预测框架,采用混合决策树-AdaBoost方法筛选30个临床特征,结合SMOTE过采样和10折交叉验证防止数据泄露,并通过贝叶斯优化支持向量机实现97.67%准确率、100%敏感性和99%曲线下面积,显著优于逻辑回归、随机森林等传统模型;SHAP解释分析揭示典型胸痛、年龄和射血分数等关键预测因子,结合95%置信区间验证模型鲁棒性,为心血管风险分层提供可解释且临床实用的工具,符合网络生理学对心血管系统互联特征的研究范式。
心血管疾病冠状动脉疾病冠状动脉疾病预测临床特征SHAP解释特征选择支持向量机贝叶斯优化海狮优化网络生理学模型稳健性
基于特征选择和贝叶斯优化支持向量机的冠状动脉疾病预测

心血管疾病特别是冠状动脉疾病(CAD)仍是全球主要死亡原因。虽然侵入性血管造影准确度高,但成本高昂且存在风险。本研究基于扎利扎德·萨尼数据集,提出一种非侵入性、可解释的CAD预测框架。该框架采用混合决策树-AdaBoost方法筛选出30个临床相关特征。为防止数据泄露,在10折交叉验证流程中仅对每个训练折应用SMOTE过采样技术。支持向量机通过贝叶斯超参数调优进行优化,并与海狮优化算法(SLOA)和网格搜索进行对比。消融实验和威尔科克森符号秩检验确认了所提出的SVM_Bayesian模型在统计学上的优越性。SHAP解释(SHapley Additive exPlanations)分析揭示了具有临床意义的特征贡献(如典型胸痛、年龄、经胸超声心动图射血分数)。95%自助置信区间和在独立测试集上的时间泛化验证确保模型稳健性且无过拟合。该模型实现97.67%准确率、95.45%精确率、100.00%敏感度、97.67% F1分数和99.00%曲线下面积(AUC),优于逻辑回归(准确率93.02%、F1分数92.68%)、随机森林(准确率95.45%、F1分数93.33%)、标准支持向量机(准确率77.00%)以及SLOA优化支持向量机(准确率93.02%)。后续工作将验证外部真实世界数据集。该框架为CAD风险分层提供了透明、可泛化且临床实用的工具,其关注预测系统性疾病时心血管特征的互联性,符合网络生理学的基本原则。

关键词:冠状动脉疾病预测、支持向量机、贝叶斯优化、海狮优化、特征选择、网络生理学

【全文结束】

大健康
大健康