近年来,人工智能的普及度急剧上升,许多支持者对其在医学领域的潜在应用感到兴奋:例如,快速处理样本或识别人眼可能错过的疾病标志物。然而,应用人工智能是否总是最佳选择呢?
研究人员发现,虽然一种名为虚拟染色的人工智能方法在某些情况下可以改善医学影像的使用,但在其他情况下,它实际上可能会降低从这些影像中获取有用信息的能力。总体而言,他们在决定是否将人工智能应用于特定工作流程时建议保持谨慎,以确保与其它方法相比确实能提高准确性。这项研究发表在《生物医学光学快报》杂志上。
"总体结论是,人工智能可以是一个很好的工具——它在某些情况下确实有帮助——但你必须稍微谨慎一些,"贝克曼先进科学技术研究所的研究生、本研究的主要作者Sourya Sengupta说。
这项研究由无标记成像与多尺度生物光子学中心的研究人员进行,该中心旨在通过开发新的成像方法和算法来改进临床和研究应用的成像技术。除Sengupta外,CLIMB研究人员Phuong Nguyen、Frank Brooks、刘洋和Mark Anastasio都参与了该项目。
我们大多数人在医生就诊时都拍摄过医学影像,如超声波、MRI或X光。这些基本工具帮助研究人员和临床医生诊断疾病、测试新治疗方法并监测患者健康状况。另一类常见的医学影像是显微镜图像,它使临床医生能够更仔细地观察放大的组织和细胞样本。
为了提高显微镜图像的对比度——例如,使细胞的某一部分突出,以便临床医生能够分析其特征——组织或细胞样本通常使用染料或其他化学物质进行染色。尽管广泛使用,但染色可能耗时且可能损伤细胞。
无标记成像是一种不向样本添加化学物质的染色替代方法。相反,研究人员利用生物材料的自然特性进行观察并创建图像。例如,测量光线通过细胞等透明物体的不同方式,可以为我们提供有关细胞密度和生长的信息。
然而,这种方法也有缺点。无标记图像的对比度通常仍低于染色图像,这可能使识别关键特征变得困难。为了提高无标记图像的实用性和可靠性,最近人们对一种名为虚拟染色的新方法产生了兴趣。
在虚拟染色过程中,计算模型分析无标记图像并预测该图像染色后的样子。理想情况下,这将产生具有染色图像高对比度的图像,但生成速度要快得多,且不会因化学物质而损坏样本。然而,重要的是要确认这些虚拟染色图像对于生物发现和临床应用是否真正准确和有用。
"在医学或药物发现中,拍摄图像不是最终目标,"Sengupta说。"在生物医学成像中,我们总是从任务角度思考:图像是为特定的生物或临床应用服务的。因此,我们开始提出问题:这些计算机生成的图像可能看起来真实,但它们是否真的有助于实际任务?"
研究工作流程和任务性能评估策略概述。(a) 虚拟染色框架的总体示意图。这些虚拟染色图像是使用ITIT生成的。(b) 使用不同任务网络容量的任务性能评估策略示意图。虚拟染色图像、无标记图像以及真实的荧光对应图像,通过使用不同容量的任务网络进行独立评估。
回答这类问题的最大挑战之一就是拥有足够的数据。研究人员通常需要大量成对的图像——一个来自无标记成像,另一个来自荧光染色——来训练和测试各种人工智能模型。幸运的是,刘洋的团队最近开发了Omni-Mesoscope,这是一种强大的高通量成像系统,可以在几分钟内捕获处于不同状态的数万个细胞,从而创建大型高质量数据集。这些数据集为测试虚拟染色图像在实际分析任务中的表现提供了基础。
研究人员测试了虚拟染色图像在两项任务中与无标记图像和染色图像相比的表现。首先,图像用于分割任务:神经网络识别单个细胞核并将它们裁剪为各自独立的图像。就像裁剪照片一样,这使研究人员和临床医生能够专注于图像中最重要的部分。
其次,研究人员将图像用于细胞分类任务,其中网络识别不同细胞在药物治疗后的阶段。这项任务在研究和疾病治疗中用于监测药物有效性。
从左到右:输入的无标记图像块、基于Pix2pixHD的虚拟染色输出、基于EffU7的虚拟染色输出、真实的荧光标记图像。与真实的荧光图像相比,虚拟染色预测中的错误示例用边界框标出。红色边界框显示有丝分裂细胞中的强度差异,导致虚拟染色输出中出现明亮的眩光。绿色边界框突出显示了预测中紧密排列的细胞被错误合并的情况。
两个细胞的无标记图像(第一列)、虚拟染色图像(中间列)和荧光染色图像(最后一列)的比较。底部行的细胞经过药物处理,而顶部行的细胞则没有。
对于这两项任务,研究人员评估了使用每种图像类型时不同网络的性能。研究人员想知道每种图像类型的相对成功率是否会根据所用网络的特性而变化,因此他们使用五种不同的网络重复了这些任务。
许多网络执行类似的任务,但根据网络被编程学习的方式,某些网络可能比其他网络更擅长表示复杂功能或关系。这些网络被称为高容量网络。本研究中使用的网络具有各种容量,因此研究人员可以观察容量是否影响网络使用虚拟染色图像的方式。
当由低容量网络处理时,虚拟染色图像的表现比无标记图像要好得多。然而,对于高容量网络,情况并非如此。在应用于分割任务时,虚拟染色图像和无标记图像在高容量网络处理下表现大致相同。然而,在应用于细胞分类任务时,虚拟染色图像的表现明显更差。换句话说,当使用高容量网络分析图像时,如果使用无标记图像而不是虚拟染色图像,您更有可能获得准确的信息。
Sengupta表示,这一结果与一种称为数据处理不平等的概念一致,该概念指出处理任何图像(如通过虚拟染色)都不能增加该图像中包含的信息。这类似于修饰家庭照片:你可以模糊背景使人物突出,但无论进行多少编辑,都无法打开在快门点击时正在眨眼的人的眼睛。
低容量网络可能会因虚拟染色图像而受益,因为处理可以强调重要信息。相比之下,高容量网络已经能够从无标记图像中提取复杂关系,因此虚拟染色对其没有帮助。虚拟染色过程甚至可能移除对某些任务至关重要的信息,这可以解释为什么在细胞分类任务中,虚拟染色图像的表现比无标记图像更差。
虽然人工智能在医疗保健的许多领域具有潜在应用,但Sengupta提醒对此技术感兴趣的临床医生、研究人员和公众了解其局限性。如果人工智能用于特定任务,重要的是要验证它在该情况下是否确实有益。
"即使人工智能现在是一个流行词,当你在生物医学成像和医疗保健等敏感领域应用它时,你也必须稍微谨慎一些,"Sengupta说。"在很多情况下,人工智能非常有用,但它可能并不总是如此。"
更多信息: Sourya Sengupta等,《关于任务网络容量对下游应用中虚拟染色效用的影响》,《生物医学光学快报》(2025)。DOI: 10.1364/boe.576061
期刊信息: 《生物医学光学快报》
由贝克曼先进科学技术研究所提供
【全文结束】


