多囊卵巢综合征(PCOS)在女性中越来越常见,这主要归因于不良的生活方式选择。根据美国国立卫生研究院的研究,PCOS是一种常见于育龄女性的内分泌疾病,已成为导致不孕的重要因素。PCOS引起的卵巢异常会带来很高的流产、不孕、心脏问题、糖尿病、子宫癌等风险。PCOS的症状包括卵巢囊肿、肥胖、月经不规律、雄性激素水平升高、寻常痤疮、脱发和多毛症等。由于不同女性的症状组合不同,诊断标准多样,PCOS的诊断并不容易。进行生化测试和卵巢扫描是一个耗时且昂贵的过程,这给患者带来了经济负担。因此,PCOS的早期预后对于避免不孕至关重要。本研究的目的是基于临床数据分析PCOS症状以进行早期诊断,并将其分类为受PCOS影响或未受影响。为实现这一目标,利用了Kaggle上的临床特征数据集和超声图像数据集。最初考虑了541个实例的45个临床特征,如睾酮、多毛症、家族史、BMI、快餐、月经失调、风险等,并应用基于相关性的特征提取方法,得到了17个特征。将提取的特征应用于逻辑回归、朴素贝叶斯和支持向量机等多种机器学习算法。根据准确性、精确性、召回率、F1分数评估每种方法的性能,结果表明,在这三个模型中,支持向量机模型的准确率高达94.44%。此外,还通过基于卷积神经网络(CNN)的深度学习算法和VGG16迁移学习算法分析了3856张超声图像。使用训练准确率、损失和验证准确率、损失来评估这些模型的性能,结果表明VGG16的验证准确率为98.29%,优于CNN模型。
PCOS临床数据集的统计信息如下:训练数据中受PCOS感染的有142例,未感染的有291例,总计433例;测试数据中受PCOS感染的有35例,未感染的有73例,总计108例;总计受PCOS感染的有1


