加州大学洛杉矶分校的研究人员开发了一种新型人工智能模型,可在极短时间内完成对疾病3D医学影像的专业级分析,效率远超人类临床专家。
这款名为SLIViT(SLice Integration by Vision Transformer)的深度学习框架,可分析视网膜扫描、超声视频、CT、MRI等多种影像模式的数据,识别潜在的疾病风险生物标志物。
领导该研究的UCLA计算医学专家Eran Halperin教授表示,该模型在多种疾病分析中表现出高度准确性,优于许多现有的特定疾病基础模型。其创新的预训练和微调方法依托大规模公开数据集,使模型能够以相对较低的成本部署,普及专家级医学影像分析。
研究团队使用NVIDIA T4 GPU和V100 Tensor Core GPU,以及NVIDIA CUDA进行研究。当前医学影像专家常处于超负荷状态,患者通常需要等待数周才能获得X光、MRI或CT扫描的结果。
SLIViT的优势在于能规模化分析患者数据,且具备持续升级能力。当新的医学影像技术出现时,模型可通过新数据微调,即时应用于未来分析。Halperin指出:"在缺乏影像专家的地区,该模型未来可能显著改善患者诊疗结果。"
研究显示两项意外成果:首先,尽管主要基于2D扫描预训练,模型却能精准识别3D器官扫描中的生物标志物。传统3D模型依赖昂贵的3D数据集训练,而本研究通过2D数据预训练加少量3D数据微调的方法,表现优于纯3D训练模型。
其次,模型展现出卓越的迁移学习能力。例如在视网膜2D扫描数据上训练后,仅需肝脏MRI数据微调,模型即可识别完全不同器官和成像技术的特征。研究者发现,不同器官和成像技术间存在共享的基础特征,这种跨域学习能力突破了传统模型的局限。
该研究成果已发表在《自然-生物医学工程》杂志,研究者认为该模型可大幅减少人工标注图像需求,通过识别疾病生物标志物理解患者疾病轨迹,未来有望实现基于生物标志物的个性化治疗。
【全文结束】


