一项发表在《JAMA Network Open》上的最新研究评估了商业人工智能(AI)工具在临床诊断前数年通过乳腺 X 光筛查检测亚临床乳腺癌的效果。
研究:亚临床乳腺癌检测的人工智能算法。图片来源:Okrasiuk / Shutterstock.com
使用乳腺 X 光筛查中的人工智能可以帮助医生在诊断前数年识别乳腺癌风险,为个性化预防治疗和更有效的护理开辟道路。
在 2022 年,全球有超过 230 万女性被诊断出患有乳腺癌,当年有超过 67 万人死于乳腺癌。在美国,乳腺癌是影响女性最常见的癌症类型,每年该国新出现的女性癌症中有三分之一影响乳腺组织。
美国疾病控制与预防中心(CDC)目前建议 40 岁及以上的女性每两年接受一次乳腺 X 光检查以筛查乳腺癌。尽管其应用广泛,但乳腺 X 光检查的准确性有限。
最近,一些人工智能算法已获批准以提高放射科医生报告的准确性,通过标记可疑区域并生成癌症评分以提供更准确的诊断。事实上,一些研究表明,这些评分可以在临床特征出现之前预测未来的乳腺癌风险。
关于这项研究
当前的研究包括了挪威九个乳腺中心的 116495 名女性,她们每两年接受三次或更多次连续的乳腺 X 光筛查。这些乳腺 X 光检查在 2004 年 9 月 13 日至 2018 年 12 月 21 日期间进行。
所有乳腺 X 光检查结果都使用 INSIGHT MMG(一种市售的人工智能算法)进行了人工智能分析。重要的是,INSIGHT MMG 最初并非为估计未来癌症风险而设计,也未针对此任务进行优化。
该算法提供了一个连续变量,即癌症检测评分,范围从 0 到 100。分数越高,表明乳腺 X 光检查呈阳性的风险越高。
在癌症筛查呈阳性、阴性和在两次乳腺 X 光检查间隔期间确诊癌症的女性的乳房之间,比较了最大的人工智能评分和评分的绝对差值。
评分差异
该研究队列包括 1265 名和 116495 名分别乳腺癌筛查呈阳性和阴性的女性,以及 342 名在乳腺 X 光检查间隔期间被诊断出患有乳腺癌的女性。在第三次筛查中乳腺癌筛查呈阳性的女性平均年龄为 58.5 岁,而间隔癌症女性和筛查阴性女性的平均年龄分别为 57.4 岁和 56.4 岁。
计算了双侧乳房人工智能评分的平均绝对差值(MADs)。对于未患癌的女性,这三个轮次的差值分别为 9.9、9.6 和 9.3。
在第三轮中被筛查出患有癌症的女性,其在第一轮、第二轮和第三轮的人工智能评分的 MAD 分别为 21.3、30.7 和 79。在间隔癌症的女性中,每轮的 MAD 分别为 19.7、21 和 34。
在癌症发生的乳房中,评分高于另一侧乳房,这种增加在癌症最终被检测到的四到六年前就存在。在每一轮中,区分筛查阳性和无癌女性的受试者工作特征曲线(AUCs)下面积分别为 0.64、0.73 和 0.97。对于间隔癌症,每一轮的 AUCs 从 0.66 增加到 0.78。
对于通过筛查发现患有癌症的女性,每一轮中评分绝对差值的 AUCs 分别为 0.63、0.72 和 0.96。相比之下,间隔癌症每轮的相应值分别为 0.64、0.65 和 0.77。当考虑所有乳腺癌时,所有轮次之间的 AUCs 从 0.64 增加到 0.93。
间隔癌症似乎发展得更快,并且在乳腺 X 光片中更有可能被影像学隐藏,而不是被放射科医生遗漏。
将检查级人工智能评分的前 1%视为癌症阳性,其余 99%视为阴性,绝对评分阈值为 91.3。在这个阈值下,三轮中分别有 4.5%、8.6%和 53%的癌症会有阳性的人工智能评分。在每个研究轮次中,0.7%的女性会出现假阳性评分。
结论
研究结果表明,有可能使用人工智能乳腺 X 光评分在诊断前六年估计乳腺癌风险。癌症发生的乳房的平均绝对人工智能评分高于另一侧乳房,这反映在更高的 MAD 评分中。
基于 MAD 评分,INSIGHT MMG 能够准确地区分未来癌症风险增加的女性与无癌女性。使用人工智能,被确定有高患乳腺癌风险的女性随后可以接受额外的筛查和其他个性化干预措施以预防乳腺癌。
“随着时间的推移以及乳房之间人工智能评分的差异增加,可以被解读放射科医生用来表明患乳腺癌的风险升高。”
期刊参考:
Gjesvik, J., Moshina, N., Lee, C. I., 等. (2024). 亚临床乳腺癌检测的人工智能算法. JAMA Network Open. doi:10.1001/jamanetworkopen.2024.37402.


