AI助力乳腺癌检测的工具在乳腺X线筛查中带来了突破性的改进,帮助放射科医生更早发现更多癌症,同时减少了不必要的患者召回。
最近发表在《自然医学》杂志上的一项研究考察了人工智能(AI)对癌症检测和召回率的影响。乳腺X线筛查有助于降低乳腺癌相关死亡率。进一步提高筛查的敏感性和特异性可以降低间期癌症率、召回率,并更有效地治疗乳腺癌患者。筛查项目生成了大量的乳腺X线影像,大多数项目要求由两名放射科医生进行解读。此外,可能还需要召开共识会议以实现高特异性和敏感性。因此,放射科医生的工作涉及每周重复解读大量图像的任务。值得注意的是,随着最近指南建议对额外年龄段进行乳腺X线筛查,这种工作量可能会增加。将AI纳入癌症筛查项目可以缓解一些问题。
研究表明,AI在准确性方面与放射科医生相当,甚至有时更高。尽管关于召回率的结果不一致,但几项研究观察到,在整合AI的工作流程中,癌症检测率有所提高。然而,这些早期研究的样本较小,放射科医生、筛查地点和设备供应商的异质性较差,限制了其普遍性。
研究及发现
AI集成显著提高了导管原位癌(DCIS)的检测率,从对照组每1000名女性中有0.8例上升到AI组的1.4例。这可能代表更早的癌症检测,但也引发了过度诊断的担忧。
在这项研究中,研究人员评估了AI对癌症召回和检测率的影响。研究在德国的一个针对50至69岁无症状个体的乳腺癌筛查项目中进行,数据收集时间为2021年7月至2023年2月。在筛查项目中,每位参与者拍摄四张乳腺X线影像,最初由两名独立的放射科医生阅读。如果其中一名放射科医生认为病例可疑,则召开共识会议。如果会议后仍存在可疑发现,参与者将被召回进行进一步评估。
当报告由至少一名放射科医生使用AI支持的查看器阅读并提交时,该检查被纳入AI组。未使用基于AI的查看器提交的检查被纳入对照组。放射科医生可以选择使用现有的(非AI)软件或AI支持的查看器。
AI系统Vara MG具有两个关键功能:正常分类,标记高度不怀疑的检查为正常;安全网,突出显示高度可疑的病例并提供可疑区域的定位。这个安全网旨在通过提示放射科医生重新审查AI标记为不怀疑的发现来减少漏诊。
共有461,818名女性接受了乳腺X线筛查,119名放射科医生进行了检查。其中,260,739人被纳入AI组,201,079人被纳入对照组。约有42名每1000名女性的检查结果可疑,需召回进行进一步评估。约四分之一的患者进行了活检,超过六名每1000名女性被诊断为乳腺癌。
AI系统将59.4%的检查分类为正常,显著减少了放射科医生的工作量。AI组中1.5%的检查触发了安全网,导致541次召回和208例癌症诊断。此外,AI组中3.1%的检查被AI标记为正常,但经过共识小组的进一步评估后,又确诊了20例癌症。乳腺癌检测率(BCDR)分别为AI组每1000名女性6.7例和对照组5.7例。
AI组的BCDR统计上高于对照组,召回率略低。AI组和对照组的召回阳性预测值(PPV)分别为17.9%和14.9%。AI组的活检率比对照组高出8.2%,但AI组的活检PPV(64.5%)高于对照组(59.2%)。
更广泛的含义和未来考虑
AI将59.4%的乳腺X线影像分类为正常,减少了放射科医生解释正常病例的时间达43%,从而腾出更多时间用于复杂分析。
研究强调,将AI集成到筛查工作流程中可以增加导管原位癌(DCIS)的检测。虽然这可能代表更早的检测,但也引发了对过度诊断和过度治疗的担忧,因为这些病例并不总是会发展为侵袭性癌症。长期影响如间期癌症率和分期分布需要在未来两到三年内进一步跟踪。
此外,研究人员指出,被拒绝的安全网案例是一个重要的分析领域,因为它们可能包括早期检测癌症的错失机会或减少不必要的召回的价值。
综上所述,AI方法在乳腺X线筛查中提供了自信的可疑和正常预测。AI组的BCDR比对照组高17.6%。AI的使用还导致了稍低的召回率,尽管统计上不显著。这些发现为AI辅助乳腺X线筛查的安全性、可行性和减少工作量提供了证据。
(全文结束)


