罕见疾病往往难以诊断,临床医生预测最佳治疗方案也颇具挑战。为应对这些难题,哈佛医学院与布莱根妇女医院马哈茂德实验室的研究人员开发出一种深度学习算法。该算法能自主学习特征,进而用于在大型病理图像库中寻找相似病例。
名为SISH(组织病理学自监督图像搜索)的新工具如同病理图像搜索引擎,具备多种潜在应用价值,包括识别罕见疾病并帮助临床医生确定哪些患者可能对类似疗法产生响应。描述该自学习算法的研究论文已于10月10日发表在《自然·生物医学工程》期刊上。
哈佛医学院与布莱根妇女医院病理学助理教授、资深作者法伊萨尔·马哈茂德表示:"我们的系统能协助诊断罕见疾病,并在无需人工标注和大型监督训练数据集的情况下,找出具有相似形态学模式的病例。该系统有望改进病理学培训、疾病亚型分类、肿瘤识别以及罕见形态识别。"
现代电子数据库可存储大量数字记录和参考图像,尤其在病理学领域广泛使用全切片图像(WSIs)。然而,单个WSI的千兆像素级尺寸及大型图像库中日益增长的图像数量,导致WSI的搜索与检索过程缓慢复杂。因此,可扩展性仍是高效使用的主要障碍。
为解决此问题,研究团队开发了SISH算法。它能自主学习特征表示,以恒定速度在病理学中查找具有相似特征的病例,且检索速度不受数据库规模影响。在研究中,团队测试了SISH检索常见及罕见癌症可解释疾病亚型信息的速度与能力。该算法成功从包含2.2万余患者病例、50余种疾病类型及十余个解剖部位的数万张WSI数据库中快速准确检索图像。在多种场景下(特别是疾病亚型检索),其检索速度优于其他方法,且当图像数据库规模扩展至数千张时仍保持优势。即使库容持续扩大,SISH仍能维持恒定搜索速度。
该算法存在一定局限性,包括内存需求大、对大型组织切片的上下文感知有限,且仅适用于单一成像模式。总体而言,算法展示了独立于库容规模高效检索图像的能力,并在多样化数据集中表现出色。它不仅能有效诊断罕见疾病类型,还可作为搜索引擎识别诊断相关图像区域。这项研究将为未来疾病诊断、预后及分析方法提供重要参考。
马哈茂德表示:"随着图像数据库规模持续扩大,我们希望SISH能简化疾病识别过程。该领域的重要发展方向是多模态病例检索,即联合使用病理学、放射学、基因组学及电子病历数据来寻找相似患者案例。"
本研究部分获得美国国家普通医学科学研究所R35GM138216项目(资助对象:F.M.)、布莱根院长基金、布莱根与麻省总医院病理科、布莱根精准医学计划、谷歌云研究基金及英伟达GPU资助计划支持。另有塔乌贝塔皮学会奖学金及美国国家癌症研究所露丝·L·柯什斯坦国家服务奖T32CA251062提供额外支持。作者声明不存在利益冲突。
(改编自布莱根妇女医院新闻稿)
【全文结束】


