核心要点
- 哈佛研究人员开发了BrainIAC,这是一种单一AI模型,可适应分析从阿尔茨海默病到癌症等各种疾病的脑部扫描,无需为每种疾病构建单独的算法
- 该模型从32,000例未标记的磁共振成像扫描中学习了大脑的一般解剖结构,随后仅需每类别1至5个训练样本即可适应新的医疗任务
- BrainIAC在七项不同挑战中表现出色,包括预测癌症生存率、检测基因突变和发现早期痴呆:这些任务单靠医生使用扫描难以或无法完成
- 这种方法可以加速针对影响小患者群体的罕见疾病的AI工具开发,在这些情况下收集数千个标记样本是不可行的
构建AI系统来诊断脑部疾病通常意味着每次都必须从头开始。想要检测阿尔茨海默病?那就需要一个算法。脑肿瘤?再构建另一个。中风损伤?重新开始。现在,哈佛医学院的研究人员证明了有更好的方法。
他们训练了一种名为BrainIAC的单一AI模型,该模型可以适应从发现早期痴呆到预测癌症生存率等各种任务。同一个系统首先从数万例不同疾病的磁共振成像扫描中学习了大脑的一般解剖结构,随后仅需少量样本即可适应罕见的儿童脑肿瘤。
这一突破解决了医学领域最大的AI难题之一。医院存储着数百万例脑部扫描,但大多数无法用于训练AI,因为没有人有时间和资金让医生标记每一幅图像。BrainIAC首先从未标记的扫描中学习,自主掌握了大脑解剖结构的模式。
教会AI识别脑部模式
以医学生为例。他们学习放射学并非通过一次记忆一种疾病。他们首先研究正常大脑解剖结构,然后学习识别异常情况。BrainIAC的工作原理相同。
该模型在《自然神经科学》杂志发表的研究中,分析了来自十种不同疾病患者及健康志愿者的32,000多例脑部扫描。它自主学习了捕获大脑结构、年龄相关变化、中风损伤模式和肿瘤解剖的内部表征:整个过程无需明确标签。
一旦BrainIAC理解了大脑的一般解剖结构,研究人员仅需极少量额外训练即可使其适应新任务。他们在七项完全不同的医疗挑战中测试了该模型:识别扫描类型、通过脑结构推测年龄、预测哪些癌症患者生存期更长、检测脑肿瘤中的关键基因突变、发现早期痴呆、估算中风发生时间以及勾勒肿瘤边界。
该模型处理了医生单凭磁共振成像难以或无法完成的任务。预测肿瘤是否携带特定基因突变(通常需要脑部手术和基因检测)达到了约0.79的AUC值。对于医生仅凭扫描无法做出的诊断,这是一个强劲结果。
首席研究员本杰明·坎恩博士发现,最大优势体现在训练数据稀缺的罕见疾病上。仅用50个样本,BrainIAC在基因突变预测中达到了约0.68的AUC值。从头训练的传统AI系统表现 barely 比随机猜测好。
从极少数据中学习
研究团队将此推向了极限。如果每种扫描类型只有一个样本呢?他们在数据集极小的情况下进行了实验,这种限制在影响全球仅数百名儿童的超罕见疾病研究中经常遇到。
即使总共只有四个训练样本,BrainIAC仍能比随机猜测更准确地分类四种不同扫描类型。对于胶质母细胞瘤——一种最致命的脑癌之一,该模型预测患者是否能存活超过一年。即使只有10%的训练数据,它在一年生存率预测中仍达到约0.62的AUC值。从头训练的系统则退化到 barely 比抛硬币好一点。
这背后有简单原因。儿童脑癌可能每年仅影响全国50名儿童。你永远无法收集10,000个标记训练样本。BrainIAC的方法意味着研究人员可以为影响少量患者的疾病开发AI工具,这在当今基本上是不可能的。
该模型甚至关注了相关脑区。当研究人员可视化BrainIAC的关注点时,发现它针对痴呆检测聚焦海马体(阿尔茨海默病中会萎缩的脑区)、针对衰老变化关注白质区域、针对癌症预测关注肿瘤核心。这些注意力图与已知神经解剖结构一致,表明模型学习的是具有医学意义的特征而非任意模式。
为何此前未能成功
当前医疗AI系统在离开原开发医院后往往表现不佳。在麻省总医院开发的算法可能在德克萨斯州的医院失效,因为MRI扫描仪不同、患者群体差异,甚至技术人员摆放患者的姿势都有区别。
坎恩团队通过在多机构扫描数据上训练BrainIAC,然后在完全不同医院的数据上测试来验证这一点。他们还故意用常见技术问题干扰图像:对比度偏移、模糊、强度变化。BrainIAC比从头训练或窄域预训练的替代模型更能处理噪声,尤其是在其他模型性能崩溃的困难预测任务上。
目前的局限性
BrainIAC仅适用于标准结构磁共振成像扫描,即放射科医生每天查看的基本序列。它无法处理显示脑活动的功能磁共振成像或专业扫描。更重要的是,这仍是研究阶段。团队分析了多年收集的扫描,但这与前瞻性测试不同——在前瞻性测试中,AI会在医生决策时实时运行。目前尚不清楚它是否能真正改善患者预后、加速诊断或在临床实践中改变治疗选择。
更大图景
目前,每个医疗AI项目都在重复造轮子。一个研究小组花两年时间构建脑肿瘤检测器。另一个花两年时间开发阿尔茨海默病筛查工具。每个项目都需要单独的资金、数据收集和验证。
基础模型则颠覆了这一模式。构建一个理解脑解剖的系统,然后快速适应你提出的任何医疗问题。需要为新发现的疾病开发工具?微调基础模型而非从头开始。每年仅30例的罕见儿童癌症?基础模型给你一个良好的起点。
这种方法不会取代大型医疗中心为单一任务优化的专业AI系统。但它可能大幅降低为服务不足疾病、罕见病和资源有限环境开发AI工具的门槛——在这些场景中收集大规模训练数据是不现实的。
坎恩团队报告称,该模型和代码已公开供研究使用,意味着其他研究人员可以在此基础上开展工作。无论BrainIAC本身是否被广泛采用,抑或仅证明概念,其关键意义在于展示了单一AI系统确实可以适应从阿尔茨海默病到脑癌的广泛脑部影像任务。
【全文结束】

