心血管疾病特别是冠状动脉疾病(CAD)仍是全球主要死亡原因。虽然侵入性血管造影准确度高,但成本高昂且存在风险。本研究基于扎利扎德·萨尼数据集,提出一种非侵入性、可解释的CAD预测框架。该框架采用混合决策树-AdaBoost方法筛选出30个临床相关特征。为防止数据泄露,在10折交叉验证流程中仅对每个训练折应用SMOTE过采样技术。支持向量机通过贝叶斯超参数调优进行优化,并与海狮优化算法(SLOA)和网格搜索进行对比。消融实验和威尔科克森符号秩检验确认了所提出的SVM_Bayesian模型在统计学上的优越性。SHAP解释(SHapley Additive exPlanations)分析揭示了具有临床意义的特征贡献(如典型胸痛、年龄、经胸超声心动图射血分数)。95%自助置信区间和在独立测试集上的时间泛化验证确保模型稳健性且无过拟合。该模型实现97.67%准确率、95.45%精确率、100.00%敏感度、97.67% F1分数和99.00%曲线下面积(AUC),优于逻辑回归(准确率93.02%、F1分数92.68%)、随机森林(准确率95.45%、F1分数93.33%)、标准支持向量机(准确率77.00%)以及SLOA优化支持向量机(准确率93.02%)。后续工作将验证外部真实世界数据集。该框架为CAD风险分层提供了透明、可泛化且临床实用的工具,其关注预测系统性疾病时心血管特征的互联性,符合网络生理学的基本原则。
关键词:冠状动脉疾病预测、支持向量机、贝叶斯优化、海狮优化、特征选择、网络生理学
【全文结束】


