古哈·巴拉克里希南(Guha Balakrishnan)和库沙尔·维亚斯(Kushal Vyas)创建了MetaSeg,该模型使用90%更少的参数即可达到与U-Net相当的MRI分割准确度。(图片来源:Jeff Fitlow/Rice University)
当医生查看脑部扫描图像时,图像的每个细节——每个像素或体素——都必须被细致标记。大脑皮层、海马体、脑室和其他结构都需要被标注,以便医生能够诊断疾病、规划手术或监测病情。这就是医学影像分割,几十年来这一直是一项费力且繁琐的任务。
这项繁琐的工作已经手动进行了几十年,直到人工智能的出现。近年来,U-Net等深度学习算法改变了临床医生标记和解读扫描图像的过程。但尽管U-Net是优秀的软件,它们需要庞大的数据集和超级强大的计算机才能使用。对于小型研究团队或医院来说,这可能使成本高昂的AI驱动影像技术超出预算。
现在,莱斯大学(Rice University)的研究人员可能解决了这一问题。他们开发的新系统MetaSeg与U-Net同样准确,但只需要一小部分硬件资源——根据实验,参数减少了约90%。该模型由库沙尔·维亚斯(Kushal Vyas)、阿肖克·维拉加万(Ashok Veeraraghavan)和古哈·巴拉克里希南(Guha Balakrishnan)开发,结合了机器学习中的两个前沿概念:隐式神经表示(INRs)和元学习。
库沙尔·维亚斯是莱斯大学电气与计算机工程专业的博士生,也是论文的第一作者。(图片来源:Jeff Fitlow/Rice University)
更简单、更智能的分割路径
传统模型如U-Net和视觉变换器通过处理大量标记数据集来学习。MetaSeg则采用了不同的方式。它使用隐式神经表示,这是一种将每张图像作为连续信号而非像素网格进行处理的数学过程。隐式神经表示可以高效地保留极其精细的细节和紧凑信息,但迄今为止无法推广到训练以外的单一图像。
莱斯大学的研究人员通过让隐式神经表示学会"学习如何学习"来避免这一限制。MetaSeg包含了元学习,这是一种AI模型能够从新信息中快速学习的技术。本质上,它不仅从训练图像中学习,还从学习过程中学习。
"与使用U-Net不同,MetaSeg采用了隐式神经表示——一种迄今为止未被发现对图像分割有用或进行探索的神经网络框架,"电气与计算机工程专业的博士生、论文主要作者维亚斯说道。
该模型由两个主要组件组成:一个用于预测像素强度值的重建网络,以及一个用类别标签标记这些像素的分割头。在训练过程中,内循环告诉模型拟合单个图像,而外循环调整系统,使其能够很好地处理多种图像。
通过几轮嵌套训练,MetaSeg学会了一种初始化方法,使其能够在几次梯度更新中适应新的扫描图像。实际上,它能够接收新的脑部MRI,通过几步适应,输出适当的分割图——而且在测试时不需要使用标注数据。
MetaSeg概述。MetaSeg与U-Net同样准确,但只需要一小部分硬件资源——约90%更少的参数。(图片来源:Springer Nature)
性能远超其轻量级规模
为验证MetaSeg的潜力,研究人员使用了包含400多张脑部MRI扫描的OASIS-MRI数据集。数据被划分为训练、验证和测试集,并对多达35个脑部区域进行分割标注。研究人员还将MetaSeg与公认的基准模型进行了比较,如用于2D扫描的U-Net和用于3D分割的SegResNet。
性能表现令人惊叹。对于2D MRI分割,MetaSeg在仅83,000个参数的情况下达到了Dice分数0.93(通常用此指标评估准确度),而U-Net在770万个参数的情况下才达到0.96。对于精细的24类分割,MetaSeg甚至以微弱优势超过了U-Net,在仅100万个参数的情况下达到了0.86。在3D MRI扫描中,它以十分之一的参数数量达到了与SegResNet相同的0.95准确度。
这些结果使题为"拟合像素,获取标签:用于图像分割的元学习隐式网络"的论文从1000多篇被接受的论文中脱颖而出,荣获医学图像计算与计算机辅助干预(MICCAI)会议最佳论文奖。
MetaSeg也很快达到了最佳性能。经过两次迭代,模型的Dice分数达到0.85,到100次迭代时提高到0.95。相比之下,竞争对手需要数千次迭代才能达到相似的精度。
MetaSeg INR拟合测试图像像素时,重建和分割性能的示例进展。(图片来源:Springer Nature)
教会AI识别解剖结构
为了解MetaSeg学到了什么,研究人员使用主成分分析将模型的内部特征投影到可视化空间。结果表明,MetaSeg自然地学会了区分重要的解剖区域,如海马体、基底神经节和大脑皮层。
消融测试——移除模型不同部分的测试——显示其性能依赖于同时进行重建和分割训练。仅在图像上训练的模型在Dice分数上得分为0.81,但当两个目标同时实现时,分数提高到0.93。这种综合关注使MetaSeg不仅能够识别结构的外观,还能理解它们在整个图像上下文中的意义。
挑战与发展空间
没有模型是完美的,MetaSeg也存在一些弱点。它确实表现出对空间错位的一些敏感性——旋转或平移扫描可能会使性能下降几个百分点。研究人员认为,在训练过程中增加更多数据增强可以克服这一限制。尽管如此,该系统在大多数测试中表现稳健,甚至能够以惊人的准确性处理低分辨率扫描。
由于隐式神经表示将图像视为连续信号,MetaSeg可以在像素和体素之间无缝互操作。也就是说,它可以将低分辨率信息扩展为高质量的分割图,这在临床环境中可能特别有用,因为扫描质量可能不一致。
MetaSeg和标准隐式神经表示对2D测试扫描学习的倒数第二层特征的PCA可视化。(图片来源:Springer Nature)
推动医疗AI普及
莱斯大学电气与计算机工程助理教授、Ken Kennedy研究所成员古哈·巴拉克里希南描述了这一新框架如何提供"一种新的、可扩展的方式进入医学图像分割领域,而该领域在过去十年一直被U-Net所主导。"
MetaSeg的效率使其能够轻松应用于计算能力有限的情况。没有高端GPU访问权限的小型诊所、乡村医院或研究机构可以使用它来进行高效精确的扫描分析。其自适应结构还可以在医学之外找到应用,在卫星成像、自动驾驶汽车或工业检测中推动分割任务。
该团队的研究是莱斯大学不断发展的数字健康研究文化的一部分,包括数字健康倡议和与莱斯-休斯顿卫理公会合作的数字健康研究所。巴拉克里希南和莱斯大学电气与计算机工程系主任维拉加万希望,MetaSeg的成功意味着医疗AI不需要庞大昂贵才能有效。
迈向更智能、更精简AI的一步
在一个更大模型占据大部分头条的领域,MetaSeg有着不同的愿景——更小、更精简的系统也能提供一流的结果。它的成就也挑战了"更大的网络和更多的数据默认等于更好的结果"这一观念。
通过关注AI如何学习而非学习多少,莱斯大学团队证明了性能和效率不必相互对立。MetaSeg能够快速学习,甚至从无标签数据中学习,这是使医疗成像技术在资源匮乏环境中普及的重要进步。
正如主要作者库沙尔·维亚斯向Brighter Side of News解释的那样:"在这项工作中,我们引入了MetaSeg,一种全新的图像分割方法。"
该工作的实际应用
MetaSeg可能通过降低成本和处理时间来改变医生阅读扫描的方式。由于它对适度的数据和计算资源效率高,小型医院和研究实验室可以在没有昂贵基础设施的情况下使用强大的诊断能力。
该方法在医学之外也显示出前景——其低资源需求可用于环境监测、自动驾驶汽车或工厂质量控制。
最后,MetaSeg对隐式神经表示和元学习的整合预示着一个世界:AI模型不仅更有能力,而且更可持续、更具包容性。
研究结果已在线发表于Springer Nature期刊。
【全文结束】


