肺部成像领域中基于数据驱动的分类和可解释人工智能Data-driven classification and explainable-AI in the field of lung imaging

环球医讯 / AI与医疗健康来源:www.frontiersin.org未提及 - 英语2024-09-23 00:00:00 - 阅读时长8分钟 - 3926字
本文探讨了用于肺部疾病分类的各种数据集、预处理技术、性能指标、分类方法,以及胸部疾病研究中的进展和挑战,并对不同模型进行了比较分析。
肺部成像数据驱动分类可解释人工智能肺部疾病胸部X光图像肺炎分析机器学习技术深度学习模型数据集数据预处理性能指标迁移学习集成模型可解释性胸部疾病分类
肺部成像领域中基于数据驱动的分类和可解释人工智能

在医学影像中,检测肺部疾病对放射科医生来说极具挑战性,即使是经验丰富的专家在准确诊断胸部疾病时也可能遇到困难,复杂或未见过的生物标志物可能导致潜在的不准确。本综述论文深入研究了近期在肺部疾病分类研究中使用的各种数据集和机器学习技术,重点是使用胸部 X 光图像进行肺炎分析。探讨了传统机器学习方法、预训练深度学习模型、定制卷积神经网络(CNN)和集成方法,并对不同分类方法进行了综合比较。

分析表明,基于 CNN 的迁移学习方法和集成模型/特征在肺部疾病分类中表现出优越性能。此外,本综述还为其他利用放射学图像的医学领域的研究人员提供了见解。通过对各种技术的全面概述,有助于建立有效的策略和确定合适的方法来应对各种挑战。目前,研究人员在机器学习和深度学习模型及其分类任务应用中,除了传统评估指标外,还强调了可解释人工智能(XAI)技术的重要性,其有助于深入理解决策过程,提高信任度、透明度和整体临床决策水平。本综述不仅对致力于利用机器学习和 XAI 推进肺部疾病检测领域的研究人员有价值,也对来自其他不同领域的研究人员有帮助。

本论文分为多个部分。第 2 节关注数据集及其模式。第 3 节描述数据预处理和平衡技术,第 4 节讨论研究中使用的不同性能指标。第 5 节详细阐述了该领域提出的多种技术,第 6 节对胸部疾病分类中使用的所有技术进行了详细的比较分析和讨论。第 7 节探讨了胸部疾病相关研究工作的进展和挑战。最后,第 8 节总结了本综述工作。

当代有多种带有标签的肺部疾病数据集可供训练各种机器学习和深度学习算法,这些数据集为训练、验证和测试算法提供了丰富资源。本研究重点关注了几个包含胸部疾病数据的基准数据集,并回顾了在这些数据集上的肺炎实验。包括 OCT-CXR 数据集、CHEST X-ray 14 数据集、MIMIC-CXR-JPG 数据集、PneumoCAD 数据集、COVID-19 数据集、PediCXR 数据集、CheXpert 数据集和 NIH Chest X-ray 数据集。

预处理旨在通过减少变化和消除可能在处理阶段引起复杂情况的差异来提高图像质量,从而减少资源消耗。其主要目标包括去除噪声、增强对比度以及校正亮度和颜色。为去除噪声,广泛使用均值、中值滤波器和高斯低通滤波等。形态学技术也用于增强图像信息。对比度拉伸和直方图均衡技术常用于对比度增强。对于亮度、颜色校正和颜色标准化,也使用了如 Gastal 和 Oliveira(2012)等技术。

此外,标准 X 光图像通常尺寸较大,包含不必要信息,需要大量存储空间和强大硬件进行分析。许多公开数据集对图像进行了尺寸调整以节省时间和获得更好结果。同时,研究强调了平衡实验数据集对于训练、验证和测试集的重要性,不平衡数据集可能导致对多数图像集的偏向分类,因此使用数据平衡技术来防止这种偏向结果。

肺炎检测和分类的性能指标取决于多种因素,包括真阳性、真阴性、假阳性和假阴性。通过这些因素计算出的性能指标包括准确率、灵敏度、特异性和精度。

随着时间的推移,机器学习方法在医学领域得到了广泛应用,有助于解决新的医学问题。本综述基于 CXR 数据集对肺炎相关研究进行了回顾,遵循相同框架。包括传统机器学习模型,如 Oliveira 等人使用 Haar 小波变换特征提取和 KNN 算法实现 97%准确率;Sousa 等人比较了不同机器学习技术,SVM、KNN 和朴素贝叶斯分类器分别达到 77%、70%和 68%的准确率;Yao 等人使用 40 张 CXR 图像和机器学习进行纹理分析,SVM 模型在肺炎检测任务中准确率达 85%。

深度学习模型在各领域推动了研究工作,限制了标准手工检测和分类机制的使用。深度学习模型由多层相互连接并有指定功能的层组成,在生物医学领域由于监督学习,其在大量训练集上表现出色。目前深度学习领域正在被采用以使系统完全自驱动,提供更好结果和更少错误。

在定制的 CNN 模型方面,Stephen 等人提出的模型在 OCT-CXR 数据集上通过数据增强技术实现 93.7%测试准确率;Jain 等人比较了 6 个模型,其中基于 3 个卷积层的模型在 CXR 数据集上准确率达 92.31%;Siddiqi 提出的 18 层卷积神经网络在 OCT-CXR 数据集上准确率、特异性和灵敏度分别为 94.3%、86%和 99%;Labhane 等人在不同模型上使用自定义-CNN 和迁移学习技术,在 OCT-CXR 数据集上准确率约 97%;Liang 和 Zheng 提出定制的 49 卷积层残差模型和知名的 VGG-16 等模型,在 OCT-CXR 数据集上进行分类,结论是定制模型在分类上表现更好;Saraiva 等人比较了常规多层感知器和定制深度学习模型在 OCT-CXR 数据集上的二分类,深度学习模型准确率达 94%,常规神经网络模型达 92%;Yi 等人设计的智能系统在 OCT-CXR 数据集上实现 98.02%训练准确率和 96.09%测试准确率;Akbulut 引入创新的 ACL 模型,结合注意力和 LSTM 模型及 CNN 框架,在不同训练-测试比例下准确率表现出色;Kiliçarslan 等人开发新的深度学习方法,引入 Superior Exponential 激活函数,在肺炎分类中准确率达 95.37%。

在迁移学习模型方面,Rajaraman 等人将自定义 CNN 模型与 VGG-16 再训练模型在 OCT-CXR 数据集上比较,VGG-16 表现更好,准确率分别为 96.2%和 93.6%,并使用 Grad-CAM 可视化图像区域;Rahman 等人使用 4 种预训练卷积神经网络模型在 OCT-CXR 数据集上进行实验,DenseNet 准确率分别为 98%、95%和 93.3%,并使用 LIME 解释模型预测;Hashmi 等人应用迁移学习方法分类正常或肺炎,通过数据增强技术使知名基础深度模型准确率达 98%,优于普通深度学习模型,并使用 SHAP 解释模型;Ayan 和 Ünver 使用 VGG-16 和 Xception 在 OCT-CXR 数据集上诊断肺炎,VGG-16 准确率 87%优于 Xception 的 82%,并使用显著图技术可视化图像区域;Alshmrani 等人提出深度学习架构用于多类肺部疾病分类,使用 VGG-19 和自定义-CNN 模型的集成方法,准确率、精度和灵敏度分别达 96.48%、97.56%和 93.75%,并使用注意力图解释模型。

在集成特征/模型方面,Chouhan 等人在 OCT-CXR 数据集上使用多个深度学习算法模型,通过投票分类器实现 96%准确率,并使用积分梯度解释模型;Togaçar 等人在 OCT-CXR 数据集上应用 3 个预训练深度模型,通过最小冗余最大相关算法和线性判别分析分类器实现 99%二分类准确率,并使用特征重要性技术解释特征重要性;Ukwuoma 等人提出基于卷积网络和变压器编码器机制的混合工作流程,在二分类和多分类任务中分别实现 99.21%和 98.19%的准确率,并使用 XAI、LIME 和注意力图算法解释模型。

在比较分析中,评估了各种传统机器学习和深度学习模型的性能,包括定制的 CNN、迁移学习和集成模型,使用不同特征提取技术。ML 组中 Oliveira 等人使用 k-NN 分类器达到 97%准确率;在定制神经网络组,Labhane 等人达到约 97%准确率;在预训练迁移学习技术组,Rahman 等人和 Hashmi 等人达到 98%准确率;在最后一组,Togaçar 等人使用迁移学习和集成特征技术达到 99%准确率。总体而言,Togaçar 等人表现出色,表明迁移学习与集成方法是一种有效技术。

随着人工智能的发展,在开发改进算法方面变得更加便利,减少了对射线图像手工特征的依赖。研究人员在创建自动提取特征和采用机器学习/深度学习技术的算法方面取得了重大进展,特别是在使用深度学习算法检测和分类胸部疾病方面。然而,实际适用性的缺乏阻碍了高效算法的广泛使用,需要在相关研究与公众和医疗社区之间建立用户友好的接口,同时存在训练资源不足的问题。此外,虽然使用机器学习/深度学习检测肺炎的研究在增加,但关注可解释性的作品相对有限。

人工智能在应对医学图像中肺部疾病检测的挑战方面展现出巨大潜力,取代了传统手工方法并显著提高诊断准确性。本综述介绍了使用四个标准肺部放射成像数据集进行胸部疾病分类的大量研究。其中,CXR 数据集在综述工作中比 ChestX-ray14、JSRT 和 MC 数据集更常用。为分类,采用了不同图像预处理和特征提取技术训练不同机器和深度学习算法。总体发现,与机器学习、定制深度学习模型和迁移学习模型相比,迁移学习技术与集成模型/特征效果很好。此外,本工作强调了 XAI 的重要性,其在有限作品中的使用可以揭示隐藏的推理。本综述不仅有利于肺部疾病相关研究人员,也能增加对图像、机器学习、机器视觉、深度学习等相关领域研究人员的兴趣。

作者贡献包括概念化、数据管理、方法、资源、软件、可视化、撰写初稿、撰写评审和编辑等方面。

研究得到了欧盟地平线 2020 研究与创新计划等的资助。

作者声明不存在利益冲突。

出版商指出,本文所有主张仅为作者观点,不一定代表其所属组织、出版商、编辑和审稿人的观点。任何可能在本文评估的产品或制造商的主张,均未得到出版商的保证或认可。

参考文献列出了众多相关研究。

大健康
大健康