加州大学洛杉矶分校的一组研究人员开发了一种具有人工智能(AI)的模型,能够准确解释 3D 图像并预测疾病风险因素。
与 2D 图像相比,3D 图像增加了深度,但需要专家花费更多时间、技能和注意力来解读。训练有素的临床专家需要几分钟才能在 3D 视网膜成像扫描(可能包含近 100 个 2D 图像)中检测疾病生物标志物,例如测量解剖肿胀的体积。
首席研究员、加州大学洛杉矶分校计算医学的博士后研究员 Oren Avram 博士在一份声明中表示:“虽然有许多用于分析 2D 生物医学成像数据的 AI(人工智能)方法,但使用标准资源编译和注释标准 3D 模型所需的大量体积数据集是不可行的。存在几种模型,但它们的培训工作通常侧重于单一成像模式和特定器官或疾病。”
该团队开发了名为 SLviT(通过视觉转换器进行切片整合)的 AI 模型,它可以将体积扫描转换为 2D 图像以生成单个预测。该模式包括两个人工智能组件的组合和独特的学习方法。
加州大学洛杉矶分校的博士生、文章的共同第一作者 Berkin Durmus 在新闻稿中表示:“SLIViT 通过利用更容易获得的 2D 领域的先前‘医学知识’克服了训练数据集大小的瓶颈。”
研究人员在 8 项任务上对机器学习模型进行了评估,包括对 6 个数据集和 4 种体积成像模式(计算机断层扫描(CT)、磁共振成像(MRI)、光学相干断层扫描(OCT)和超声)的分类和回归。此外,开发人员还通过 3D 视网膜扫描(OCT)研究该模型以评估疾病风险生物标志物、通过心脏功能的超声视频、肝脏疾病严重程度评估的 3D MRI 扫描以及胸部结节恶性筛查的 3D CT。
SLIViT 的表现优于特定领域的最先进模型。研究表明,它具有临床应用潜力,与临床专家的手动工作的准确性相匹配,但将他们的工作量减少了 5000 倍。
Durmus 说:“与其他方法不同,SLIViT 足够灵活和强大,可以处理并非总是完美有序的临床数据集。”
该模型还节省了培训专家如何大规模注释生物医学图像中新识别的疾病相关风险因素所需的时间。使用小数据集,单个训练有素的临床医生可以在几天内注释新的风险因素,加快了注释过程。
SLIViT 不仅提高了诊断效率和及时性,还为加速未来预测模式的发展提供了基础模式。
未来的研究包括研究其他治疗方式,研究如何使用 SLIViT 进行预测性疾病预测以改善早期诊断,并探索防止 AI 模式中的系统性偏差以减少健康差异的方法。
加州大学洛杉矶分校健康中心的眼科学教授、Doheny 眼科研究所的人工智能与成像研究主任 SriniVas R. Sadda 医学博士说:“最让我兴奋的是 SLIViT 在现实生活条件下的出色表现,特别是在训练数据集数量较少的情况下。对于几乎每个与 3D 生物医学成像注释相关的实际案例,SLIViT 只需数百个——而不是数千个——训练样本就能蓬勃发展,这使它比其他标准的基于 3D 的方法具有很大的优势。”
参考文献
- Avram, O., Durmus, B., Rakocz, N. et al. Accurate prediction of disease-risk factors from volumetric medical scans by a deep vision model pre-trained with 2D scans. Nat. Biomed. Eng (2024).
- New AI Model Efficiently Reaches Clinical-Expert-Level Accuracy in Complex Medical Scans. News Wise. September 28, 2024. Accessed October 1, 2024.


