商业骨折检测产品中的人工智能:诊断测试准确性的系统评价和荟萃分析
Artificial intelligence in commercial fracture detection products: a systematic review and meta-analysis of diagnostic test accuracy
骨骨折是全球重大的公共卫生负担,也是急诊就诊的主要原因之一。常规 X 射线(CR)是骨折诊断的主要手段,而用于 CR 的人工智能(AI)是一个快速发展的领域,旨在提高效率和诊断准确性。然而,市场上可用的商业 AI 骨折检测解决方案(CAAI-FDS)在不同解剖区域的诊断性能、与人类评估的协同作用以及行业资助对报告准确性的影响尚不清楚。
本研究按照 Cochrane 诊断测试准确性系统评价手册和 PRISMA-DTA 报告进行,包括产品识别和系统评价两部分。产品识别部分通过荷兰拉德堡德大学医学中心的诊断图像分析组和美国放射学院数据科学研究所的数据库进行。系统评价部分通过 PubMed 和 Embase 数据库搜索相关研究,并进行筛选和评估。
最终纳入 17 项研究进行荟萃分析。结果显示,独立 AI 研究的综合敏感性良好,特异性中等。不同身体区域的诊断准确性有所不同,肋骨和脊柱的准确性较低。行业资助的研究敏感性略高,特异性略低。不同评估者(独立 AI、无人协助的人类评估、有人工智能协助的人类评估)的比较表明,有人工智能协助的人类评估的特异性显著高于独立 AI,无人协助的人类评估的敏感性显著低于其他两组。
讨论部分指出,本研究发现大多数测试的 AI 工具和解剖区域具有良好的诊断准确性,但肋骨和脊柱除外,与人类评估结合使用时性能最佳,行业资助对诊断准确性的影响较小。研究还存在一些局限性,如数据库更新和完整性不明确、研究异质性等,未来需要进一步研究。
结论部分强调,实施 CAAI-FDS 时,AI 与人类评估相结合可实现最佳诊断准确性,临床医生应了解不同解剖区域的诊断差异,实施反馈渠道、制定标准、进行独立研究、规范披露等措施有助于提高其性能和可靠性。同时,政策制定者应支持其临床应用,以提高诊断准确性和医疗效率。
声明:本文仅代表作者观点,不代表本站立场,如有侵权请联系我们删除。
本页内容撰写过程部分涉及AI生成(包括且不限于题材,素材,提纲的搜集与整理),请注意甄别。