心力衰竭(HF)是全球发病率和死亡率的重要原因,在诊断检测成本高昂且资源有限的地区负担尤为沉重。本研究探讨了常规血液学、凝血和生化参数能否通过机器学习(ML)预测心力衰竭患者的B型钠尿肽、高敏肌钙蛋白和C反应蛋白。
方法:
我们在尼日利亚阿巴卡利基亚历克斯·埃克韦梅联邦大学教学医院前瞻性招募了579名成年心力衰竭患者。采集10毫升静脉血进行实验室检测,并从医疗记录中获取人口统计学和临床数据。使用Python 3.12处理数据,应用相关性阈值、递归特征消除等特征选择技术及其标准库。训练并评估九种模型,为每种生物标志物选择最佳模型,并进行性别分层分析以比较男女参与者的表现差异。
结果:
重要预测指标包括尿素、肌酐、eGFR、D-二聚体、纤维蛋白原和中性粒细胞与淋巴细胞比值(NLR)。整合所有参数的模型表现优于单一领域模型。CatBoost对BNP的预测效果最佳(决定系数R² 0.30-0.33),ElasticNetCV对高敏肌钙蛋白效果最佳(R² 0.09-0.12),Ridge/ElasticNetCV对CRP效果最佳(R² 0.53-0.54)。SHAP分析表明尿素和D-二聚体对BNP影响显著,而NLR、eGFR和纤维蛋白原对高敏肌钙蛋白和CRP的预测贡献最大。性别分层模型在各算法中表现一致,预测强度仅存在细微差异。
结论:
在资源有限地区的心力衰竭患者中,常规实验室数据可通过机器学习有效估算B型钠尿肽、高敏肌钙蛋白和C反应蛋白。
【全文结束】